2017-05-08 10 views
0

管理対象のElasticsearchサービスを使用したい問題がありますが、特に必要なプラグインがありません。プラグインはピンインプラグインで、カスタムトークナイザを提供します。私はElasticsearchに挿入する前に前処理ステップでこのトークンを複製することを考えました。Elasticsearchにトークン化前のテキストを挿入

私は出力

{ 
    "tokens": [ 
    { 
     "token": "ldh", 
     "start_offset": 0, 
     "end_offset": 3, 
     "type": "word", 
     "position": 1 
    }, 
    { 
     "token": "liu", 
     "start_offset": 0, 
     "end_offset": 3, 
     "type": "word", 
     "position": 2 
    }, 
    { 
     "token": "hua", 
     "start_offset": 0, 
     "end_offset": 3, 
     "type": "word", 
     "position": 4 
    } 
    ] 
} 

を受け取る_analyze?text=%e5%88%98%e5%be%b7%e5%8d%8e&analyzer=pinyin_analyzerを呼び出す場合たとえば、私は前処理工程では、このようなトークンを生成するための方法を持っているが、それは、その後Elasticsearchに予め解析し、それらを挿入することが可能ですインデックス?

答えて

2

トークン化された値の配列を作成できます。効果は同じです。さらに、トークン処理だけでなくすべての前処理を行っている場合は、キーワードフィールドを使用します。さもなければあなたのトークンは個別に再度分析されるでしょう。

関連する問題