2012-01-16 7 views
0

多くのファイル(多くのcppファイル)からUnicode文字を削除する必要があります。これらのユニコードを削除するスクリプトなどを探しています。ファイルは多くのフォルダにあります!ユニコードをASCIIに変換するには?

+2

「削除」とはどういう意味ですか?文字通りそれらを削除してコンテンツを無意味なままにしておきますか?あるいは、例えばéのような文字をeに置き換えるなどの試みをしますか? –

+5

@DavidM: 'e'もUnicode文字です。 –

+2

@Kerrek SB - はい、私は知っています - しかし、私たちは彼が何を意味するかを知っています... –

答えて

4

これをお持ちの場合は、iconv(C関数ではなくコマンドラインツール)を使用できるはずです。このような何か:

$ for a in $(find . -name '*.cpp') ; do iconv -f utf-8 -t ascii -c "$a" > "$a.ascii" ; done 

-cオプションiconvには、それが変換できない文字をドロップするようになります。その後、結果を確認したい、とUnicodeの入力ファイルの上書き、無地のファイル名に「.ASCII」ファイルの名前を変更、再びその上に行く:これらのコマンドの両方が未テストであることを

$ for a in $(find . -name '*.ascii') ; do mv $a $(basename $a .ascii) ; done 

注意を。それぞれdoの後にechoを追加して確認してください。

+0

Mac OS Xで動くanythtingがありますか? – kasavbere

0

Gaupolでsrtファイルを開き、ファイルをクリックし、別名で保存をクリックし、文字エンコーディングのドロップメニューからUTF-8を選択してファイルを保存します。

関連する問題