1
私はPythonとXPathを使ってウェブサイトを解析しています。私がやろうとしている何Xpathを指定しないとページ全体が解析されない
が<a>
からのhrefを抽出することであることだからここにXML(ページ)である方法は次のとおりです。
:<div id="post">
<div align="center">
<table>
<tbody>
<tr>
<td>
<td>
<a href="test01">
<tr>
<td>
<tr>
<td>
<div align="center">
<table>
<tbody>
<tr>
<td>
<td>
<a href="test01">
<tr>
<td>
<tr>
<td>
そして、ここでは、私がやったコードです
posts = page.xpath("//div[@id='posts']/div[@align='center']")
for post in posts :
print post.xpath("//table/tr[1]/td[2]/a/@href")
しかし、問題はすべてのhrefがposts
であり、1つではないことです。post
私は間違っていますか?
ああ、右!私はこれを完全に忘れてしまった!どうもありがとう! – Difender