2012-03-20 8 views
1

SQL Serverのフルテキスト処理の悪いレビューを読んだ後、Lucene.NETを使用しています。Lucene.NETでスローするテキストの量に制限がありますか。

Lucene.NETに索引付けするデータの量に注意する必要がありますか?

また、余分なデータベース呼び出しを避けるために、エントリID、タイトルなどのように、インデックス内のデータを格納するためのベストプラクティスは何ですか?

EDIT:これもhow much data lucene can handleを説明します。

+0

どのくらいのデータが話していますか? – Marcus

+0

エントリあたり500〜1000語の範囲のどこかに、タイトルと精度が含まれていません。 –

答えて

2

検索駆動型のWebサイトでは、検索インデックスリポジトリ/ドキュメントデシベルとして作用し、検索時にもナビゲーションおよびまたはファセットを生成するためだけでなく、データを提供していますこれらの日、珍しいことではありません。 Luceneはこの目的にはうまく合っていますが、Solrはさらに優れています。 SQLデータをマスタデータとして使用し、適切な頻度でインデックスを作成/再構築します。

大きなインデックスが遅く照会はなりますが、Luceneには、インデックスのサイズによって負担される前に多くのことを飲み込むことができます。

インデックスはすべての検索可能なデータで構成する必要があります。人々を索引付けしている場合は、名前と電子メールアドレスになります。 Peopleエンティティが構成されているすべてのプロパティを検索可能でなくてもインデックスに含めると、データベースに触れることはまったくスキップできます。もう1つのアプローチは、名前、電子メール、peopleIDなどを含めることで、Peopleエンティティを取得するためにIDでデータベースに問い合わせることです。

+0

マスターDBにはどのようなコンテンツを入れていますか、Luceneインデックスは何ですか?早速のご返事ありがとうございます。 –

+0

質問に答えて編集しました。 – Marcus

+0

マーカスありがとう、私が聞きたいと思っていたものです。 –