私はXPathを初めて使いました。私はXPathを使用してページを解析しようとしています。私はタグから情報を得る必要がありますが、タイトルスクリューでアポストロフィを逃れてすべてを上げました。アポストロフィ付きのPython XPath解析タグ
解析するにはGrabを使用してください。ソースから
タグ:
<img src='somelink' border='0' alt='commission:Alfred\'s misadventures' title='commission:Alfred\'s misadventures'>
実際のXPath:
g.xpath('.//tr/td/a[3]/img').get('title')
戻り
commission:Alfred\\
この問題を解決する方法はありますか?
ありがとうございます。
正直なところ、あなたの '.xpath'が何かを返すのはうれしいことです。このHTMLは、LXMLの 'html'モジュールがそれを抑制するには十分ではありません。 –
私はちょうどlxmlとBeautifulSoupを試してみましたが、どちらも正しく解析していませんでした。明らかに、属性値の外側の引用符は二重引用符でなければなりません。 htmlのソースは何ですか? – ekhumoro