2011-01-26 3 views
1

私は別のソースから、分析にApache Luceneのを使用して、ウェブページのコンテンツのグループをランク付けするシステムに働いているの最初の発生時に今直面する問題何イムを余分なブーストを追加します結果は、ソースがより良い重みを持つ1ページ以上を持っていたとき、最初に同じソースから来たページのグループを示しています。luceneのは</p> <p>、用語

luceneオプションを使用して結果をさらに絞り込むことができるので、ソースの最初のオカレンスのみがリストされ、残りは結果リストの末尾までドラッグされるので、少なくともuser最初の数ページで同じソースからのコンテンツの完全なリストを見るのではなく、異なるソースから異なる結果を最初に見ることができます....

答えて

2

最新の(未リリース)バージョンのSolr(これは、 Lucene)にはfield/result collapsingと呼ばれる機能があり、フィールドの値に基づいて結果をグループ化します。このように見えることはあなたが探しているものです:

http://wiki.apache.org/solr/FieldCollapsing

あなたはSolrのを使用したくない場合は、あなたが結果セットを反復処理に基づいて、それを並べ替えることによって、この自分で実装する必要がありますあなたの基準。これを十分に実行するには、おそらくFieldCacheを「ソース」フィールドに使用する必要があります。

+0

ありがとう、私はこれを見て、私は何ができるかを見て、あなたのフィードバックに感謝します – jiun

関連する問題