でXPathエントリからテキストを取得し、私はウェブサイトトラブルのpython
http://www.baseball-reference.com/players/event_hr.cgi?id=bondsba01&t=b
とテーブルからデータをこすりしようとしているにしています。私は1つのエントリからXPathを引くと、投手 が言う「テリーマルホランドを、」私はこれを取得:
pitchers = site.xpath("/html/body/div[2]/div[2]/div[6]/table/tbody/tr/td[3]/table/tbody/tr[2]/td/a)
私はプリンターで投手用pitcher[0].text
を印刷しようとすると、私はむしろtext
より[]
を取得し、任意のアイデアをどうして?
htmlはxmlではありません。 BeautifulSoupを使用してhtmlを解析します。 –
FUD。 lxmlはHTMLの解析には適していますが、xpathはHTML domのナビゲーションには問題ありません。 –
したがって、lxml.htmlパッケージ。 –