を作るに変換私はこのPythonのUnicodeは「のu000A」を含む中国のエラー
を試してみました私は\\uOOOA
を変換することができますどのように、文字列を修正するために、この文字列を変換したい「\ n」をせずに中国の間違ったコード
# string
s = u'蛋疼\\u000A egg烦'
を作ります
s.encode('utf-8').decode('unicode-escape')
これは\\u000A
を修正しますが、読めないちんぷんかんぷんに中国語テキストを回す:
èç¼
eggç¦
HTMLページのJavascriptコードから文字列を取得しました。
は、おそらくこのJSONですか? –
言い換えれば、*このデータはどこから来たのでしょうか?それを抽出するためのより良い方法を使用することで、おそらくこれを避けることができます。 –
いいえ、これはユニコード文字列に '\\ u000A'と中国語が含まれているため、 '\\ u000A'を '\ n'に変換して中国語を変更しません。 –