私はこの質問が多くの時間を求められて知っている。 おおよその文字列マッチングに適したアルゴリズムについての提案が必要です。おおよその文字列一致
このアプリケーションは、具体的には会社名の照合のみを対象としています。
最大の課題は、おそらく会社名の部分と短い名前の部分です 例: 1. companyA pty ltdとcompanyA pty。 ltd。会社A対 2. WESエンジニアリング対W.E.S.エンジニアリング(非常にまれな存在)
あなたはLevenshtein編集距離が適切だと思いますか?
私ははい、レーベンシュタイン距離がこれに適しているC#
よろしく、 マックス
私は、すべてのドットの文字を削除し、その後レーベンシュタイン距離を使用するつもりだと思います。 ちょうどノート、私は類似しているが、より速いlevenshtein、アルゴリズムsift3男の名前別のアルゴリズムを見つけた。とても興味深い。 – Max