2011-06-28 5 views
0

Solrへのキャロットの統合はSolr 3.2のリリース以降に改善されたと言われていますが、私は、Carrotがうまくいっていて、Solr 3.2が "他のトピック"以外の何も与えてくれなかったので、絶対に同じConfigured Solr 1.4.1 Serverを実行しました。私のそばには例外や珍しいものがないので、私は夢中になってしまいます。Solr3.2 Carrot2「その他のトピック」以外のクラスタリング

<searchComponent name="clustering" 
        enable="${solr.clustering.enabled:true}" 
        class="solr.clustering.ClusteringComponent" > 
    <lst name="engine"> 
     <str name="name">default</str> 

     <str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str> 

     <str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str> 
      <!--custom--> 
     <str name="LingoClusteringAlgorithm.phraseLabelBoost">8.00</str> 
     <str name="TermDocumentMatrixBuilder.titleWordsBoost">6.00</str> 


     <str name="carrot.lexicalResourcesDir">clustering/carrot2</str> 

     <str name="MultilingualClustering.defaultLanguage">ENGLISH</str> 
    </lst> 
    <lst name="engine"> 
     <str name="name">stc</str> 
     <str name="carrot.algorithm">org.carrot2.clustering.stc.STCClusteringAlgorithm</str> 
    </lst> 
    </searchComponent> 
    <requestHandler name="/clustering" 
        startup="lazy" 
        enable="${solr.clustering.enabled:true}" 
        class="solr.SearchHandler"> 
    <lst name="defaults"> 
     <bool name="clustering">true</bool> 
     <str name="clustering.engine">default</str> 
     <bool name="clustering.results">true</bool> 
     <str name="carrot.title">autocomplete</str> 
     <str name="carrot.url">autocomplete</str> 
     <str name="carrot.snippet">autocomplete</str> 
     <bool name="carrot.outputSubClusters">true</bool> 

     <str name="defType">edismax</str> 
     <str name="qf"> 
      text^0.5 autocomplete^1.2 ata^1.0 raum^1.0 system^1.0 assy^1.0 unit^1.0 
     </str> 
     <str name="q.alt">*:*</str> 
     <str name="rows">10</str> 
     <str name="fl">*,score</str> 
    </lst>  
    <arr name="last-components"> 
     <str>clustering</str> 
    </arr> 
    </requestHandler> 

私の最高の推測では、ニンジンを一緒に適切にウォーキングされていないということでした。でも、結果のXMLは同じ...

私はクラスタリングコンポーネントの標準構成に多くの変更をしなかったが

に見えますedismax(これはSolr 1.4.1では実装されていませんでした)ですが、それは誤解を招くかもしれません。

私はすでにこれが問題ではないことを確認するために自分のデータを再索引付けしました。

キャロットワークベンチでは、クラスタリングはアルゴリズムとしてLingoとうまくいっています。 「ソース」を選択したとき、xmlのように「他のトピック」を取得します。 Lingoはうまく構成されないかもしれませんか?それを修正するためにsolrconfig.xmlのほかに何か設定する必要がありますか?

ご協力いただきありがとうございます。

答えて

3

これは、クラスタ化しようとしている「スニペット」が決して異なっていない場合、またはほとんど違いがない場合に発生します。リクエストパラメータに 'clustering.snippet ='を追加してみてください。あなたの設定には、デフォルトである「オートコンプリート」というフィールドがあります。このフィールドに意味のあるテキストはありますか?この動作は、私のために離れて行かせる

例:

http://localhost:8983/solr/clustering?q=peter&rows=200&carrot.snippet=summary

敬具、

/ピーター・W

+0

は問題が本当にだった私の "オートコンプリート" attbibuteたありがとうtokken。私は今、別のものを使用しています。 – user523859

関連する問題