2011-12-26 56 views
0

私はutf-8ファイルとしてdictを持っていて、コマンドラインから単語を読み込んで辞書キーで検索します。しかし、私のファイルはfrom input()読み込みと変換

単語= 'şüyûh'

mydictionary [単語]

トルコ語とアラビア語の文字を持っている私のプログラムは、バック私に言葉KeyError例外として 'şüyûh' この「şüyûH」を与えます。どのように私はそれを修正することができます。

答えて

0

ファイルから読んでいる場合は、それらを理解して、あなたは文字に(ファイルはバイトのみを含めることができます)、ファイル内のバイトを解釈する方法のpythonを伝える必要があります。

これを行う最も基本的な方法は、open機能の代わりにcodecs.openを使用してファイルを開くことです。あなたがこの方法でファイルからデータを引くと、それは既に復号化されます。あなたは、ファイルをエンコードすることであるもののpythonを伝えなければならないこと

+0

私はの.pyファイル内の辞書を持って

import codecs with codecs.open("something.txt", encoding="utf-8") as myfile: # do something with the file. 

注意を。私はこれに賛辞を持っていませんが、私が読んでいる文字列が問題です。私は窓の下にいます – marco

関連する問題