次の問題の原因となるアルゴリズムや考え方はありますか?文字列の意味比較
私には、スニペット1、スニペット2の2つのスニペットがあります。次のように
スニペット1は、読み取ります
"犬が嵐の中に出て行くにはあまりにも怖かった"
を次のようにスニペット2の読み取り:
「犬を雨天に突き当たるために威嚇された "
これらのスニペットをある種のアルゴリズムや文字列理論システムを使って比較する方法はありますか?私はそれに取り組む前にこの問題を解決したシステムがあるかどうかを知りたい。
UPDATE: さて、より具体的な例を与えるために、私はチケットシステムのバグの数を減らすために望んでいたと言います。また、関連するチケットや類似のチケットがあるかどうかを調べるために何らかのスキャンを行いたいと思っていました。私はチケットのボディに基づいて問題を判断するための最良の体系的な方法を知りたかったのです。 Levenshtein Distanceアルゴリズムは、ウェットとドライの違いを知らないため、特にうまく機能しません。
このリポジトリには、質問への単語埋め込みアプローチがあります。https://bitbucket.org/yunazzang/aiwiththebest_byor – Aaron