2017-08-03 3 views

答えて

0

トークンを分割したい文字が分かっている場合は、pattern tokenizerを使用できます。すべての 'スプリッター'に一致する正規表現を指定することができます。

+0

私は正確に文字のコレクションを知っていない、パターンtokenizerは少し複雑かもしれません。今私は 'に置き換えます。と。 '分割する単語の前に、そして置換する'。 'with'。 'ビュー層内にある。 – CreateChen

+0

@CreateChenパターントークナイザが複雑すぎるかもしれません。ドットだけを置き換える場合は、[charfilter](https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-replace-charfilter.html)を見てみる価値があります。 )。これは前処理ユニットで、交換を行うことができます。それは少なくともあなたのコード全体ではなく、ESの一部になります。 – Slomo

関連する問題