Luceneを使用して店舗検索APIを開発しています。Lucene検索結果をグループ化し、カテゴリ別に頻度を計算する
私は例えば....括弧内にその周波数の各都市、州の組み合わせのための店の検索結果を表示する必要があります。今のよう
Los Angles,CA (450)
Atlanta,GA (212)
Boston, MA (78)
.
.
.
、私の検索結果は上、7000のLuceneのドキュメントの周りに戻りますユーザーが「私にすべての店舗を見せてください」と言う場合は平均です。 このユースケースでは、上に示したように、約800のユニークなCity、Stateレコードを表示してしまいます。
私はHitCollector
クラスのCollect
メソッドをオーバーライドし、次のようにベクトルを取得しています:
var vectors = _reader.GetTermFreqVectors(doc);
そこで私は、このコレクションを反復処理し、それぞれのユニークな都市、州の組み合わせのための周波数を計算します。
しかし、これはパフォーマンスが非常に遅くなっています...検索結果をグループ化してLuceneの頻度を計算する方法はありますか? コードスニペットは....私は、他の技術/ヒントを使用して、私のLucene検索コードを最適化することができれば提案してください、
また読書のための
おかげで非常に参考になります!
この回答にお答えください。 http://stackoverflow.com/questions/899542/problem-using-same-instance-of-indexsearcher-for-multiple-requests –