2011-12-18 14 views
6

lucene 3.5 contribフォルダには2つのプラグインがあります:1つはグループ化され、もう1つはファセットです。 私の選択では、それらの両方を使用してドキュメントをさまざまなカテゴリに分割しました。なぜluceneにこれ用のプラグインが2つあるのですか?luceneのグループ化とファセットの違いは何ですか3.5

答えて

22

彼らは二つの異なるLuceneの機能です:

  • Groupingが最初のLucene 3.2でリリースされた、その関連JIRAの課題はLUCENE-1421です:それは、指定したフィールドでグループの検索結果にできます。たとえば、著者フィールドでグループ化すると、著者フィールドに同じ値を持つすべての文書が単一のグループに分類されます。あなたは出力として一種の木を持っています。このlucene機能の使用をさらに深く知りたい場合は、this blog postが便利です。
  • FacetingはLucene 3.4でリリースされました。関連するjiraの問題はLUCENE-3079です。この機能はドキュメントをグループ化せず、ファセットの特定の値に含まれるドキュメントの数を示します。たとえば、著者フィールドに基づいてファセットを作成すると、すべての著者のリストが表示され、各著者について、その特定の著者に属する文書の数がわかります。後で、それらの文書を見たい場合は、もう一度特定のフィルター(author = whatever)を追加して照会する必要があります。実際にはfaceted searchは、複数のフィルタを適用して、興味のあるドキュメントに徐々にアクセスするドキュメントを参照しています。
関連する問題