3
私のschema.xmlは製品名を分割しており、分割後に重複した単語を削除するためにRemoveDuplicateを使います。なぜsolr RemoveDuplicatesTokenFilterFactoryが機能しないのですか?
<fieldType name="type_name" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.PatternTokenizerFactory" pattern="\|| " />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
とクエリアナライザで、私はRemoveDuplicatesTokenFilterFactoryが重複言葉に絶対に何もしなかったことがわかります。どうして?
重複はどのように同じ位置に存在できますか?何が原因でしょうか? – wormhit
Wikiのように、類義語のトークンは、類似のルートを使ってステミングします。 –
位置を考慮せずに複製を削除するフィルタはありますか? – lulalala