2017-06-25 5 views
0

私はanalyzerのフィールドを持つインデックスを持っています。ドキュメントごとに、analyzerは、stemmedトークン(そしておそらく補題)の検索に役立ちます。ElasticSearch:テキストフィールドからトークンや補題のリストを取得する方法はありますか

しかし、私は、トークンのリストが必要な場合は、elasticsearchアナライザによって生成された補題がこれは可能ですか?

答えて

0

これはあなたが探しているものであるかどうかはわかりません。しかし、あなたはこれを行うことができます:

GET YOU_INDEX_NAME_HERE/_analyze 

{ 
    "analyzer": "ANALYZER_NAME_HERE", 
    "text": "This Is a test text for analyze" 
} 

そして応答はトークンのリストになります。

{ 
    "analyzer": "standard", 
    "text": "This Is a test" 
} 

あなたが得る応答:

{ 
    "tokens": [ 
     { 
      "token": "this", 
      "start_offset": 0, 
      "end_offset": 4, 
      "type": "<ALPHANUM>", 
      "position": 0 
     }, 
     { 
      "token": "is", 
      "start_offset": 5, 
      "end_offset": 7, 
      "type": "<ALPHANUM>", 
      "position": 1 
     }, 
     { 
      "token": "a", 
      "start_offset": 8, 
      "end_offset": 9, 
      "type": "<ALPHANUM>", 
      "position": 2 
     }, 
     { 
      "token": "test", 
      "start_offset": 10, 
      "end_offset": 14, 
      "type": "<ALPHANUM>", 
      "position": 3 
     } 
    ] 
} 

詳しい情報documentation

でこのクエリの例

関連する問題