Pythonでのエンコーディングに関するもう1つの質問だと思います。私はこのプログラムを持っています:Pythonのデコードとエンコーディング、リスト要素utf-8
regex = re.compile(ur'\b[sw]\w+', flags= re.U | re.I)
ergebnisliste = []
for line in fileobject:
print str(line)
erg = regex.findall(line)
ergebnisliste = ergebnisliste + erg
ergebnislistesortiert = sorted(ergebnisliste, key=lambda x: len(x))
print ergebnislistesortiert
fileobject.close()
私はsまたはwで始まる単語のテキストファイルを探しています。私の "ergebnislistesortiert"は並べ替えられた結果リストです。 私は結果リストを印刷し、エンコーディングに問題があるようにappersます
[ 'そう'、 'WER'、 'のsp \のXC3']
「のsp \ xc3 'はspätと表示されます。ここで何が間違っていますか?なぜリスト要素はutf-8ですか?
「spät」を印刷するには、どうすれば正しいデコードができますか?
ありがとうございます!