私はXPathを初めて使用しています。単純なwikiスタイルのWebページをlxmlで解析することはできません。WikiスタイルのWebページの解析、XPathエラー
私は、次の式があります。それは正常に動作します
"".join(tree.xpath('//*[@id="mw-content-text"]/div[1]/p//text()'))
を、私は子供を持つクラスである「参照」を除外して、次の式でlxml.etree.XPathEvalErrorを取得する必要があります:
"".join(tree.xpath('//*[@id="mw-content-text"]/div[1]/p//*[not(@class="reference")].text()'))
正しいXPath式は何ですか?ありがとうございます。
ページとは何ですか? –