0
私は副業b"\xDF"
を持っています。 UTF-8にデコードしようとすると、UnicodeDecodeErrorがスローされます。 CP1252へのデコードは正常に動作します。どちらの文字セットでも、0xDFは文字 "ß"で表されます。だからなぜエラー? xDF(ß)をUTF-8にデコードできないのはなぜですか?
>>> hex(ord("ß"))
'0xdf'
>>> b"\xDF".decode("utf-8")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xdf in position 0: unexpected end of data
>>> b"\xDF".decode("cp1252")
'ß'
もちろん、ああ。ありがとう。 – Daniel