2017-10-06 10 views
0

私は以下の設定を使ってESインデックスを作成しました。元の文字列を置き換える弾性検索のステミング

"settings": { 
    "analysis" : { 
     "analyzer" : { 
      "my_analyzer" : { 
       "tokenizer" : "standard", 
       "filter" : ["standard", "lowercase", "my_stemmer"] 
      } 
     }, 
     "filter" : { 
      "my_stemmer" : { 
       "type" : "stemmer", 
       "name" : "english" 
      } 
     } 
    } 
} 

ステマーを分析すると、元の文字列がステム付きの単語に置き換えられます。元の文字列とstemmedトークンの両方にインデックスを付ける方法はありますか?

答えて

1

あなたの質問はstemmer token filterのための "preserve_original" パラメータについてです:

あなたが例えば "preserve_original" でしょうWord Delimiter Token Filterでは有効ですが、ステマートークンフィルタでは使用できません。

元の単語が必要な場合など。集約のために、copyフィールドを適切なアナライザーを使用して別のフィールドにフィールドすることができます。

インデックスの同じ位置にオリジナルが必要な場合は、ステマーをラップし、独自のアナライザーをpluginとして作成する必要があります。

関連する問題