私はbeautifulsoupを使ってpython scrapperを書こうとしています。私は正常にデータの大部分を抽出しましたが、私は現在、価格抽出におけるエンコーディングの問題に直面しています。ここでbeautifulsoupで廃棄されたデータのエンコーディングを修正するにはどうすればよいですか?
は私の例です:
実際のテキストは、廃棄テキストである1599€99
です:
>>>prdt.find("span",{"class":"price"}).text
u'1599\u20ac99'
"\ u20acは、" 使用して '€' 記号ことになっていますUTF-8エンコーディング:
>>>prdt.find("span",{"class":"price"}).text.encode(encoding='UTF-8')
'1599\xe2\x82\xac99'
誰でもこの問題を解決する方法はありますか?
ありがとうございました。