2016-03-24 2 views
0

私は二つの場所について混乱していますSolr synonym setting for two Chinese characters 台,臺Solr schema.xmlにAnalyzerタグのないファイルタイプ定義はありますか?

<fieldType name="text_zh" class="solr.TextField"> 
    <analyzer type="index"> 
     <tokenizer class="solr.StandardTokenizerFactory"/>  
     <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
    </analyzer> 
    <analyzer class="jeasy.analysis.MMAnalyzer" /> 
</fieldType> 

でのSolrのフィールドタイプの定義を参照してください。MMAnalyzerは、任意の解析タグ内ではありません

  1. 、これは何を意味するのでしょうか?
  2. StandardTokenizerFactoryとMMAnalyzerはどちらもテキストをトークン化します。前者は1グラムで、後者は実際に辞書検索を行います。誰が最初に来て、最後に来るの?彼らはお互いに葛藤しないのですか?何が最終結果になるでしょうか?

答えて

0

これは間違いです。正しい使用法は、索引付けと照会のために異なる分析チェーンを持つ必要があります。

これが第二アナライザがなければならないことを意味します。テキストのインデックスが作成されたときに

<analyzer type="query" class="jeasy.analysis.MMAnalyzer" /> 

その方法、それはStandardTokenizerFactoryを使用して、同義語を適用します。しかし、クエリ中にのみMMAAnalyzerを実行します。管理UIの[分析]画面で、[インデックス]テキストボックスと[クエリ]テキストボックスの両方を使用してテストし、処理手順を比較できます。

+0

ありがとうございます!私が試してみます! –