2012-03-12 7 views
0

私はすべてのプレーンテキストファイル(私はOSXを使用しています)のエディタとしてemacsに切り替えています。 notepadとtextedit(utf-8以外のエンコーディングでは)は、特定の文字がどこにあるべきかにかかわらず、 "/ some_number"という醜いスプリンクリングを持っています。 utf-8にホームフォルダの周りに広がった5k txtsを変換するのに合理的に簡単な方法はありますか? (ホームディレクトリ内のすべてのtxtファイルのパスから始めると、次はどうなるでしょうか)osx:newbie様々なエンコーディングの5k txtファイルをutf8でエンコードされたtxtファイルに変換する

答えて

1

これらのファイルを変換するには、iconvを使用できます。あなたはlatin1のエンコーディングを使用していたと仮定すると、あなたができるよう

IFS=$'\n' 
for i in `find . -name \*.txt`; do 
    iconv -f latin1 -t utf8 "$i" > "$i.utf8" && mv "$i.utf8" "$i" 
done 
+0

が、TXTのリストは、さまざまなエンコーディングのTXT年代が含まれている場合、どのような(Winのメモ帳からいくつかの、いくつかのラテン語、中国の一部)のようなもの? –

+1

この場合、ファイルごとのエンコーディングを定義する必要があります。ファイルそのものを伝える方法はありません。推測しようとすることができるヒューリスティック(ファイルのような)がありますが、それは本質的に信頼性がありません。もう1つのオプションは、 'mv'ステップをスキップして、エンコーディングごとに1つのファイルを作成し、必要なものだけを選択することです。 –

関連する問題