2011-06-29 10 views
5

クラスタリングのためにsolr wikiページをたどりました。しかし、私はクラスタリングを使うことのメリットは得られません。誰が実際に何がcluseringであり、どのようなインデックス作成と検索でそれを使用しているか教えてください。solrクラスタリングコンポーネントとは

答えて

9

クラスタリングは、「一緒に属している」グループへのグループのデータに統計的手法で返信してください。 具体的には、これは、特定のクエリの結果をグループ化し、それらのグループにラベルを付けることを試みることを意味します。

これにより、返される結果の性質に関する追加情報を得ることができます。 例:非常に幅広いドキュメントで 'Python'を検索した場合、クラスタリングコンポーネントは 'The Python programming language'、 'Python the snake'などのグループを作成することがあります。

Carrot2デモのデモサイト:(Carrot2はSolrのに同梱クラスタリングエンジンである)

http://search.carrot2.org/stable/search

Solrのクラスタリングコンポーネント(Carrot2)は結果リストにSolrので返されたテキストフィールドを使用して文書をクラスタリングします。 (使用されるフィールドは設定可能です) テキストフィールドの用語を使用して、クラスタを構築し、それらにラベルを付けます。

http://project.carrot2.org/publications/carrot2-dresden-2007.pdf

+3

そしてもちろんの 'モンティ・パイソン':非常に興味深いCarrot2のウェブサイト上のプレゼンテーションがあり

! – JanRavn

+0

どのような基準で結果をグループ化しますか。私はそれが結果にラベル付けする方法を意味します – Romi

+3

Solrのクラスタリングコンポーネント(Carrot2)は、Solrによって結果リストに返されるテキストフィールドを使用してドキュメントをクラスタリングします。 (使用されるフィールドは設定可能です) テキストフィールドの用語を使用して、クラスタを構築し、それらにラベルを付けます。 Carrot2のウェブサイトには、非常に興味深いプレゼンテーションがあります。 http://project.carrot2.org/publications/carrot2-dresden-2007.pdf – JanRavn

関連する問題