私はPythonを通してXPathを試してきました。Python。特定のXPath式が動作しない
事はありませんすべての式が動作していることです。
私はちょうどXPathのヘルパー Chromeの拡張機能を発見しました。
あなたがChromeを見るようにXPathを検出するが、Pythonはありません。
ウェブサイト:link
マイコード:
import __future__
from lxml import html
import requests
from bs4 import BeautifulSoup
page = requests.get('http://directory.ccnecommunity.org/reports/rptAccreditedPrograms_New.asp?sort=institution')
soup = str(BeautifulSoup(page.content, 'html.parser'))
tree = html.fromstring(soup)
smth = tree.xpath('/html/body/table[@class="center"][2]/tbody/tr[1]/td[2]/table[2]/tbody/tr/td/table/tbody/tr/td[2]/table/tbody/tr/td/text()')
print(smth)
smth
リストは空です。どうして?それはXpathに示されているすべてのtd
で構成されているはずです。
これは、htmlが壊れていることを意味しますか?私はそれをどのように修正することができます... 私は 'BeautifulSoup'から' html.parser'引数がこの問題を解決しますと思いました。 –