excelの中に私はアーティスト、曲、エディションのリストがあります。 このリストには15000を超えるレコードが含まれています。 問題は、リストに「重複」レコードが含まれていることです。彼らは完全なマッチではないので、私は "複製"と言う。いくつかのタイプミスがあり、これを修正してそのレコードを削除したいと考えています。項目のリストはほとんど重複を見つける
したがって、たとえばいくつかのレコード:
ABBA - Mamma Mia - Party
ABBA - Mama Mia! - Official
各ダッシュは、私はExcelで重複としてマークしますどのように別の列(その3列A、B、Cが記入されている)
を示していますか?
ツールファジールックアップについて知りました。しかし、私はマックに取り組んでいます。マックでは利用できないので、私は立ち往生しています。
正規表現の魔法またはvbaスクリプトで何ができますか? 行がどれほど似ているかを知ることもできます(たとえば、80%の類似度)。
これは私が有用であると判明した唯一のファジーマッチングコードです:http://www.mrexcel。com/forum/excel-questions/195635-fuzzy-matching-new-version-plus-explanation.html –