1

は、例えば、リストが 「ABCD E」可能性があり、リストを命じ、その他: 「CBEADHGFIJK」元のリストと最も類似しているリストを見つける方法を教えてください。私はいくつかのうちの番号を取得しようとしています

だから私は、一連のある、いくつかの信頼できるデータを持っています各文字列に関連付けられたリストを並べ替え、どの自動化された方法が同じリストを同じ文字列のリストに一致させる(またはできるだけ似ている)ように同じリストを取得するのが最善であるか評価しようとしています。私の信頼できるデータ

私は統計に強い背景がありません。私はあなたがそれらを実装する方法を理解するのに役立つリンクやリソースを使用する方法を参照できることを願っていました。

答えて

1

解決策は、あなたの類似性の概念に依存します。一般的な類似度の1つは、Levenshtein distance(ある文字列を別の文字列から取得するために必要な文字数の追加、削除および変更の数)です。

関連する問題