2012-04-26 12 views
3

私のschema.xmlは製品名を分割しており、分割後に重複した単語を削除するためにRemoveDuplicateを使います。なぜsolr RemoveDuplicatesTokenFilterFactoryが機能しないのですか?

<fieldType name="type_name" class="solr.TextField"> 
     <analyzer type="index"> 
      <tokenizer class="solr.PatternTokenizerFactory" pattern="\|| " /> 
      <filter class="solr.LowerCaseFilterFactory"/> 
      <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> 

とクエリアナライザで、私はRemoveDuplicatesTokenFilterFactoryが重複言葉に絶対に何もしなかったことがわかります。どうして?

enter image description here

答えて

4

あなたがWikiを読めば、あなたはそれだけでここにそうではありません同じ位置で重複を削除していることがわかります。

+0

重複はどのように同じ位置に存在できますか?何が原因でしょうか? – wormhit

+2

Wikiのように、類義語のトークンは、類似のルートを使ってステミングします。 –

+1

位置を考慮せずに複製を削除するフィルタはありますか? – lulalala

関連する問題