from input（）読み込みと変換

私はutf-8ファイルとしてdictを持っていて、コマンドラインから単語を読み込んで辞書キーで検索します。しかし、私のファイルはfrom input（）読み込みと変換

単語= 'şüyûh'

mydictionary [単語]

トルコ語とアラビア語の文字を持っている私のプログラムは、バック私に言葉KeyError例外として 'şüyûh' この「ÅŸÃ¼yÃ»H」を与えます。どのように私はそれを修正することができます。

2011-12-26 marco

すべてをunicodeとして処理します。

2011-12-26 14:51:47

ファイルから読んでいる場合は、それらを理解して、あなたは文字に（ファイルはバイトのみを含めることができます）、ファイル内のバイトを解釈する方法のpythonを伝える必要があります。

これを行う最も基本的な方法は、open機能の代わりにcodecs.openを使用してファイルを開くことです。あなたがこの方法でファイルからデータを引くと、それは既に復号化されます。あなたは、ファイルをエンコードすることであるもののpythonを伝えなければならないこと

私はの.pyファイル内の辞書を持って

import codecs with codecs.open("something.txt", encoding="utf-8") as myfile: # do something with the file.

注意を。私はこれに賛辞を持っていませんが、私が読んでいる文字列が問題です。私は窓の下にいます – marco

答えて