私は、DjangoのWebフック(Pythonで書かれています)を介してバイトエンコードされたテキストを取り込むプログラムを持っています。非標準文字をPythonでUTF8にデコードする
encoded = request.body
decoded = parse_qs(encoded)
body = decoded[b'body'][0].decode("utf-8")
そして、これは誤りです:UTF-8は、通常の文字のために働い>が、それはアポストロフィが( ')で送信されたときに壊れ、私はこのテキストを復号化するために書かれている - 私はバイトからデコードをしています。
UnicodeEncodeError: 'ascii' codec can't encode character '\u2019' in position 5: ordinal not in range(128)
アポストロフィを正常にデコードしたいのですが。私はまた、絵文字が送られてきたらそれが壊れるかもしれないと心配しているので、覚えている絵文字と∫のようなランダムな文字をエスケープすることができます。
"バイト - > utf-8からのデコード"とはどういう意味ですか? UTF-8はUnicodeテキストを一連のバイトとしてエンコードする方法であるため、Unicode文字列をUTF-8バイトにエンコードすることも、UTF-8バイトをUnicode文字列にデコードすることもできます。 –