私はPythonにラインのこの種を分割しよう:多言語の行をPythonで分割し、Unicodeの16進値を取得するにはどうすればよいですか?
aiburenshi 爱不忍释 "לא מסוגל להינתק, לא יכול להיפרד מדבר מרוב חיבתו אליו"
この行は、ヘブライ語、簡体字中国語と英語が含まれています。私は、例えばタプルTを持っている場合は
は、私はT =(ヘブライ文字列、英語の文字列、中国の文字列)であることをタプルを取得したいと思います。
問題は、私は、ヘブライ語の文字の中国のUnicode値を取得する方法を見つけ出すないということです。これらの両方の行は機能しません。
print ((unicode("释","utf-8")).encode("utf-8"))
print ((unicode("א","utf-8")).encode("utf-8"))
そして、私はこのエラーを取得:
SyntaxError: Non-ASCII character '\xe9' in file split_or.py on line 9, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
それはあなたが(2.xまたは3.xの)を使用しているのPythonのバージョンを示す価値があるかもしれません質問、タグ、またはその両方に含まれています。 –
ファイルの先頭に#coding:utf-8などのエンコードを宣言しましたか? –
あなたが言いたい問題は、それを解決する方法を教えてくれるテキストへのリンクを含んでいる非常にクリアなエラーです。なぜあなたはリンクを読んでいないのですか?結果として、これは(http://stackoverflow.com/questions/6289474/working-with-utf-8-encoding-in-python-source)PythonソースでUTF-8エンコーディングを扱う]の重複である –