私は以前のリリースから変更された文字列のリストを持っています。いくつかの変更は簡単です(スペーシング、1単語分など)。可能であれば古い翻訳を使用するように、マイナーな違いがある文字列を検出したいと思います。類似しているが同一ではない文字列を検出するルーチンが必要です
「マイナーな相違」とはどういう意味ですか?私はデータベースで作業を始めるまでわかりません。
2つの文字列が類似しているが同一ではないことを示すチューニング可能なルーチンがありますか?どのように異なる2つの文字列があるかを示す数値を返すルーチンはどれですか?
似たような文字列の等級をつける方法が必要になります。それを行うには百万の方法があります。ここにスレッドがあります。さまざまな答えを見てください:http://stackoverflow.com/questions/4323977/string-similarity-score-hash –
上のリンクや下のリンクにない新しいものを見つけたら、確かにクールでしょう。戻ってきて、あなたがしたことを教えてください。 –