私は自分の作品のネットワーク上で動作する多数のアプリケーションに関する情報をそれぞれ与える2つのスプレッドシートを持っています。彼らは決して対応していなかった2人の別々の人々によって作られました。Levenshteinフレーズの距離/文字列マッチングアルゴリズム
結果として、アプリケーションに与えた名前はシート間で一定ではありません。しかし、彼らは似ています。たとえば、アプリケーション「Office 2010」、その他の「MS Office 10」などを呼び出すことができます。
私はLevenshteinアルゴリズムを調べましたが、これは単語の順序が一定で、スペルのみが異なる単一の単語またはフレーズにのみ適用されるようです。 (私はコンピュータ科学者ではなく、これで私を修正してください)。
したがって、私はあるシートの各名前について、他のシートのすべての名前を繰り返して、最も近いものを見つけるアルゴリズムを探しています。完璧である必要はありませんが、何かが助けになります。
アイデア?助けることができるすべての人に感謝します。