2017-02-23 6 views
1

私はスウェーデンのtxtファイルをcatしたいと思います。Ubuntu/Bashの文字エンコーディングの問題

特殊文字(äまたはéなど)の場合は、次の文字が戻ってきます。

例えば、 rhanfr nApornas planet。

複数のソースから複数のファイルがあり、そのうちのいくつかが正しい結果を返します(例:Dethärärfel!)。その一部が上記の問題を引き起こします。

これに基づいて、問題はファイルの文字エンコードであることがわかりましたが、コマンドラインでファイルをエンコードする方法を見つけることができません。

私が試してみた:

iconv -f UTF-8 -t UTF-16 file.txt 

とsimilarsを。 しかし私はいつもエラーメッセージで終わった。

ヒントはありますか? ありがとう!

+0

'chardet file.txt'の出力は何ですか? –

+0

スウェーデン語の最も一般的なエンコーディングは 'iso-8859-1'と' utf-8'です。最新のシステムでは、 'iconv -f iso-8859-1 -t utf-8 file.txt'がそれを行うべきです。古すぎる古いPuTTYや古いLinuxディストリビューションでは、 'iconv -f utf-8 -t iso-8859-1 file.txt'が実行されます。 –

+0

@RicardoBranco、ありがとう、それは欠けていた命令だった、私は持っていなかった! –

答えて

1

はコメントに基づいて解決されました:

最初に実行します。

chardet file.txt 

は、文字エンコーディングを見つけるために。その後

iconv -f iso-8859-1 -t utf-8 file.txt 

は "翻訳" を作成します。

関連する問題