ASCII以外の文字列のUnicode表現をPython文字列に変換するにはどうすればよいですか?非ASCII文字列のUnicode表現をそのままPython文字列に変換するには?
> str = '<some-arabic-content>'
> decoded_str = str.decode('utf-8')
> decoded_str
u'\u0623\u0646\u0633\u0646\u0629'
> str(decoded_str)
<WILL-THROW-AN-ERROR-OFC> since ascii cannot encode the unicode string
は、どのように私はPythonの文字列として( '\ u0623 \ u0646 \ u0633 \ u0646 \ u0629')、この表現を得るのですか?下のような
> str_rep = '\u0623\u0646\u0633\u0646\u0629'
私はdecoded_str
からstr_rep
に着陸したいと思います。これをやり遂げるにはどうすればいいですか?
どのPythonのバージョンですか? – danielfranca
python2.xのこの種の問題(エンコード/デコード)を解決するpython3.xをお勧めします。 – Wonka
変数名として 'str'を使用しないでください。 – user2728397