対私はインデックスを作成しながら、私はESのedge_n_gramsを使用して複数の単語(フレーズ)の提案を構築しようとしている...私はそれを行う方法を理解していることを考えElasticsearchを使用してオートコンプリートを実装するトークナイザは、トークンフィルタ
をしようとしていますクロールされたデータ
tokenizer
とtoken_filter
の違いは何ですか - 私は、これらのドキュメントを読んで、まだそれらのより多くの理解を必要としてきました....例えば
は、ESは、ユーザーに対して検索するために使用するものであるtoken_filter入力? ESがトークンを作るために使うのはトークナイザですか?トークンとは何ですか?
これらのいずれかを使用して複数単語の候補を作成することはできますか?
多くのありがとうとわかりやすく説明しました – user3125823
私はES 1.7を使用していますが、この回答が示唆しているものとは異なる出力を生成します。 't、th、the、q、qu、qui、... 'のトークン化とトークン自体は同じですが、オフセットと位置は異なります。フィルタ: '{" token ":" qui "、" start_offset ":4、" end_offset ":9、" position ":2}' Tokenizer: '{" token ":" qui "、" start_offset ":4、" end_offset ":7、" position ":6}' –