私は下図のようにUTF-8としてエンコードされたテキストファイルf.txt
た:Wind
ながらlike
がgrep
コマンドで見つけることができるようしかし、このファイルWind
とlike
で、この二つの言葉は、diiferentあるテキストファイルのエンコーディングについての混乱と、異なるエンコーディング方法間の変換方法について教えてください。
chengs-MBP:test cheng$ cat f.txt
Wіnd
like
chengs-MBP:test cheng$ FILE -I f.txt
f.txt: text/plain; charset=utf-8
を
chengs-MBP:test cheng$ cat f.txt | grep like
like
chengs-MBP:test cheng$ cat f.txt | grep Wind
chengs-MBP:test cheng$
をそして私はiconv
コマンドによってus-ascii
にこのファイルを変換したいが、私は失敗しました::、それは私を混同することはできません
chengs-MBP:test cheng$ iconv -f UTF-8 -t US-ASCII f.txt > new.txt
conv: f.txt:1:0: cannot convert
私の目標は、このファイル内のすべての単語がgrep
またはsed
で見つかる可能性のある形式にこのファイルを変換することです。それだけです。
私は 'のiconv -l'、UTF-8およびUS-ASCIIの両方で試験した両方のフォーマットは'のiconv -l' – Arash
@Arashににに記載されていることを確認してリストにしています。この2つの単語をここにコピーすることもできますか?同じ問題があるかどうかを知るためには、「W'nd」、「like」? –
これは私のためにうまくいく: 'printf" Word \ nlike \ n "| iconv -f UTF-8 -t US-ASCII' – Arash