2011-07-12 26 views
0

Hallo、複数の引数を持つCarrot2クラスター

私はSolrとCarrot2を使用するSearchEngineに取り組んでいます。

何でもいいですがキャロットは私が理解できない奇妙なことをします。 私はSolrからResultsを取得し、Carrotを使用してそれらをクラスタリングしたいと考えています。私はすべてを統合し、それはうまくいくが、キャロットは私の属性の一つに集中している。結果に一致し、他の属性は一致しません。同様に:

データ

名:ピーター 町:ロンドン 趣味:ゴルフ、

名スキー:アーサー 町:ベルリン 趣味:ゴルフ、

をサイクリングします名前:パリ 町:ロンドン 趣味:ゴルフ、ハイキング

検索中:ゴルフ

クラスタのような: スキー バイク ハイキング

..butないロンドン。

それは私自身を助長しませんでしたが、CarrotClusteringWorkbenchを使用すると、他の引数でクラスタ化します。

まず、ワークベンチからSolrconfigに構成をエクスポートしようとしましたが、何も変更されませんでした。 Solrはconfigsを使用しますが、どれもこの問題に何も変えていません。

誰でも私を助けることができますか、またはexpain?

答えて

0

solrconfig.xmlにクラスタリングするフィールドの名前を入力する必要があります。 Carrot2クラスタリングワークベンチであなたのために働いていた設定を複製するには、お使いのクラスタリング要求ハンドラにこれらを入れて(またはクエリのURLで提供):

一般に
<!-- In Workbench this is "Title field name" --> 
<str name="carrot.title">name</str> 

<!-- In Workbench this is "Summary field name" --> 
<str name="carrot.snippet">features</str> 

、Carrot2のような、自然な/非構造化テキストで最高の作品検索結果、ドキュメントの抄録、またはコンテンツ。フィールドに構造化されたデータを示す文字列が含まれていると、クラスターは期待しているもの(および専用のクラスター化アルゴリズムによって生成されるもの)から遠くなる可能性があります。

関連する問題