2017-01-19 5 views
1

フレーズマッチングにファジーを含めるにはどうすればよいですか? elasticsearchのドキュメントでは、フレーズマッチングではあいまいさがサポートされていないことに言及しています。 私は文章を含む文書を持っていますが、今は文章の中にあるテキストやフレーズの共通のフレーズを探したいのですが、間違ったフレーズを検索する必要があります。elasticsearchでフレーズマッチングのファジー性

答えて

0

これを行うには、いくつかの方法があります。

  1. は空白とインデックス1トークン(私は弾性でそのためのフィルターがあると思います)などの穴フレーズを削除します。あなたの質問では、同じことをする必要があります。
  2. 名前を忘れたTokenizerがあります(誰かがここで助けてくれるかもしれません)。複数の単語を一緒に索引付けすることができます。あなたのフレーズが5ワードほどの共通の最大長を持っているなら、これはこのトリックを行うことができます。

ご注意fuzziは最大2の距離でしか動作しませんので、非常に長い文章をお持ちの場合は2で十分でなく、分割する必要があります。

関連する問題