私は古いDOS時代のワードプロセッサを使って90年代に生成されたいくつかの古いテキストデータファイルを持っています。当時の制限により、データ入力プロセス中に「単純化された」エントリが多数あります。特殊文字に似た文字を検索
たとえば、「Náufragos」という単語が「Naufragos」と入力されました。
ここで、上記のデータファイルで "Náufragos"を検索すると、grepを使って "Náufragos"を検索して検索が空になりますが、 "Naufragos" 。
私はgrepのドキュメントを梳き、広範囲にグーグルで行ったが、空になってしまった。
すべての解決方法は、ラテンアルファベットのベースの(つまり、古いデータファイルに中国語、キリル文字、日本語などはありません) 。
これにはgrepまたはおそらくperlオプションがありますか?おそらく何かのように:
grep -<magic option> Náufragos file.txt
このPerlモジュールを見てください:http://search.cpan.org/~bkb/Text-Fuzzy-0.24/lib/Text/Fuzzy.pod。単語を比較して「類似性指標」を返すことができます。あなたのサンプルワードについては、単一の文字が変更されるので、インデックスは "1"に等しくなければなりません。 – bart
http://stackoverflow.com/q/11058211/1030675 – choroba