0
リクエストをトークン化するためのルールがたくさんあります。それらのほとんどはword_delimiter
フィルターに適合しています。しかし、リクエストをトークン化するために使用する文字を指定する必要もあります。 ,
,:
,-
,_
...要求をトークン化するためにどの文字を使用するかを指定する方法は?
どうすればよいですか?カスタム・アナライザでのcharフィルタを指定することにより
リクエストをトークン化するためのルールがたくさんあります。それらのほとんどはword_delimiter
フィルターに適合しています。しかし、リクエストをトークン化するために使用する文字を指定する必要もあります。 ,
,:
,-
,_
...要求をトークン化するためにどの文字を使用するかを指定する方法は?
どうすればよいですか?カスタム・アナライザでのcharフィルタを指定することにより
、次のことができます。
文字の文字列前処理、それがトークナイザに渡される前に。文字用のフィルタには、HTMLマークアップを取り除くために使用することができる、またはワードに「&」の文字を変換する「と」:https://www.elastic.co/guide/en/elasticsearch/reference/2.0/analysis-charfilters.html
カスタム・アナライザのステップは次のとおりです。
マッピング文字フィルタは、指定された文字をトークンに前処理して、残りの分析プロセスで考慮に入れる必要があります。