2011-07-04 8 views
0

次のコードを使用してPythonインタプリタでデコードしようとすると、u'aBiyuk\xd9wa'にデコードされます。コーデックを使用したPythonのUnicodeDecodeError

"aBiyukÙwa".decode("utf-8") 

しかし、私は次のコードでcodecsモジュールを使用して、Pythonプログラム内のファイルからそれを読んだとき、それはUnicodeDecodeErrorをスローします。エラーメッセージ

file = codecs.open('/home/abehl/TokenOutput.wx', 'r', 'utf-8') 
for row in file: 

以下の通りです:

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd9 in position 8: invalid continuation byte 

この奇妙な行動を引き起こしているものを任意のアイデアは?

答えて

5

ファイルはUTF-8でエンコードされていません。それが何であるかを調べるでエンコードされています。

+1

ÙはISO8859- [1,3,10,14-16]の0xD9です。 – geoffspear

+1

CP1252も同様である。 –

関連する問題