2012-01-02 17 views
1

検索クエリに基づいてローカルデータベースの文書を検索する検索エンジンを探しています。このプロセスにはWebページは含まれていません。それらには、一連のテキスト文書(pdfおよびdocファイル)のみが含まれています。 このプロセスでは、効率的な検索エンジンをご提案ください。検索エンジンを使用してローカルデータベースから文書を検索する

答えて

1

私は最初にSolr(Luceneの上に構築されています)を試してみます。素晴らしいWebベースの管理ツールも付属しています。

+0

素晴らしい私の必要条件は、クエリを入力してローカルデータベースから最良の精度でドキュメントの最適なセットを取得することだけです。 – siddharth

+0

Ambar http://ambar.rdseventeen.com/を試してみてください。使いやすく、簡単なREST APIを持っています – SochiX

0

私はLucene/Lucene.Netを提案しますが、代替方法はherehereです。

+0

ありがとうございました。しかし、私はこれらのどれが最も効率的であるか知りたいですか?あなたは私を助けてくれますか? – siddharth

+0

あなたの要件を知らなければ、それぞれのソリューションがその賛否両論を持っているので、最も効率的な/ベストである答えが不可能になります。 – Kane

+0

私のデータベースには約200のテキスト文書があります(主にpdf)。そして私の仕事は、参照文書を使って多くのクエリを生成し、次にこれらのクエリを使って参照文書と最も一致する文書を検索することです。だから私はかなりのクエリをたくさん持っていると私はatleast平均精度を期待しています。 – siddharth

1

ツール

  1. Solr:強力なテキスト検索と動的クラスタリング。そこにあるサンプルドキュメントを試してみてください。

  2. Mahout:人気のクラスタリングALGOSは

  3. Luceneそれに既に存在している:フル機能のテキスト検索エンジンライブラリ

私の意見でのSolrは、検索目的のために最良の選択肢となります。

関連する問題