0
次のコードを使用してPythonインタプリタでデコードしようとすると、u'aBiyuk\xd9wa'
にデコードされます。コーデックを使用したPythonのUnicodeDecodeError
"aBiyukÙwa".decode("utf-8")
しかし、私は次のコードでcodecs
モジュールを使用して、Pythonプログラム内のファイルからそれを読んだとき、それはUnicodeDecodeError
をスローします。エラーメッセージ
file = codecs.open('/home/abehl/TokenOutput.wx', 'r', 'utf-8')
for row in file:
以下の通りです:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd9 in position 8: invalid continuation byte
この奇妙な行動を引き起こしているものを任意のアイデアは?
ÙはISO8859- [1,3,10,14-16]の0xD9です。 – geoffspear
CP1252も同様である。 –