2
lxmlを使ってxmlとhtmlのページを解析しようとしていて、pythonでパッケージをリクエストしています。私は、この目的のために、次のコードを使用して:Pythonでxmlとhtmlのページをlxmlで解析し、pythonでリクエストするパッケージ
:
import requests
import lxml.etree
url = ""
req = requests.get(url)
tree = html.fromstring(req.content)
root = tree.xpath('')
for item in root:
print(item.text)
このコードは正常に動作しますが、いくつかのWebページのためにその内容を適切に表示し、UTF-8が、私ドンをコードして設定する必要がありますすることはできませんこのコードでセットエンコーディングを追加する方法を知っている
私はtree = html.fromstring(req.text)を試していますが、エンコード宣言付きのUnicode文字列はlxmlでサポートされていません。 – Snaicher
が動作します。私は両方のISO - 8859 - 1、UTF - 8ページを試みた。どのlxmlバージョンを使用しますか?ページをリクエストするリンクを提供することはできますか? –
url = "http://asretebar.com/rss/feed/?c=1&m=6" req = requests.get(url) #req.encoding = "utf-8" #req.content.decode (req.encoding) tree = html.fromstring(req.text) root = tree.xpath( 'channel/item/title') print(item.text) – Snaicher