私はウェブサイトから情報を取得する単純なPythonプログラムを作成していますが、問題は、 "°"、 "Ψ"などの特殊文字を含む単語があることです。ここでPython 2.7.13 UnicodeEncodeErrorと特殊文字
は私のコードです:
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen('http://www.samplepage.sample').read()
soup = BeautifulSoup(r, "lxml")
text = soup.find_all("a", class_="some_class")
for word in text:
word = word.get_text()
word = word.encode('utf-8')
print word
出力は「°」でなければなりませんが、その代わりに、私は「°」を取得
私はアスキーでそれをエンコードしようとした場合、私は取得します古典的なUnicodeEncodeError:
for word in text:
word = word.get_text()
word = word.encode('ascii')
print word
>>> UnicodeEncodeError: 'ascii' codec can't encode characters in position 7-8:
ordinal not in range(128)
はこちら_samplepage.sample_何ですか? – ksai
それはただのウェブページです – devmon
あなたが_url_ – ksai