8
Pythonでルーマニア語を含むファイルをfile.readline()で読み込んでいます。 エンコードのために多くの文字に問題があります。UnicodeDecodeError: 'ascii'コーデックがデコードできない
例:
>>> a = "aberație" #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8
私はCP500など、UTF-8でエンコードを()しようとしましたが、それは動作しません。
正しい文字コードが見つかりません。使用する必要があります。
ありがとうございます。
編集:目的はdictionnaryにファイルから単語を格納することで、「abera \ xc8 \ x9bie」aberaţieを取得していないし、それを印刷するときに何をしようとする