私のようにUnix上で記述されたファイルがあります:のiconvユニコード未知の入力フォーマット
$file xxx.csv
xxx.csv: UTF-8 Unicode text, with very long lines
は、いくつかの特殊文字をレンダリングしますless
/vi
でそれを表示する(SSA°...)読めない(├╝)。 Windowsではこれも表示されません。 dbに直接インポートすると、特殊文字が他の特殊文字(+ä、+ñ、...)に変更されます。
これをiconvで「既定の読み取り可能な」エンコードに変換したかったのです。 私は出力が、私はそうでない私は、ファイルを推測してい
はやや別の形式でエンコードされているのと同じメッセージを返しますように、入力とUTF-8などのUnicodeを使用してのiconv
$iconv -f UTF-8 -t ISO-8859-1 xxx.csv > yyy.csv
iconv: illegal input sequence at position 1234
でそれを変換しようとすると、どのようにしてどのようなフォーマットに変換して "普遍的な"読み込み可能なのかを知ることができます...
ファイルを開くエンコードを変更できるテキストエディタで開きます。ブラウザが最悪の場合も同様です。利用可能なエンコーディングで遊んで、文字が正しく表示されるかどうかを確認します。 – deceze
私はメモ帳++で試しましたが、それは680MBで、メモ帳++はそれが大きすぎると教えてくれます。 –
ファイルは、 'file'が推測しても明らかにUTF-8ではありません。オフセット1234から始まる8バイトを、その16進数形式で表示できますか? –