"é"、 "à"などのような、フランス語の文字を含むテキストファイルからの読み込みにurllibとurllib2を使用しようとしています。URLからユニコードのテキストファイルを読み込む?
def load(url):
from urllib2 import Request, urlopen, URLError, HTTPError
req = Request(url)
f = urlopen(req)
f.readline()
for line in f:
line = line.split('\t')
word = line[0].encode('utf-8')
は私がread()メソッドは、私のバイトの文字列を返すという気持ちを持っているので、私は(「UTF-8」)はUnicode値を取得するためのエンコードを使用していますが、これは私に次のエラーを与える
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 6: ordinal not in range(128)
何が起こっているか教えてもらえますか?どんな助けもありがとう。ありがとう!