私はpeoplefinders.comからデータを削り取ろうとしています。しかし、私が検索したい部分は空に戻ります。私はjupyterノートでカーネルを実行しpython XPath for peoplefinders.com missing text items
- :
<a class = "reporttextblue" href = "..."> text text text <span></span> text text text <br/> text text text </a>
注:HTML形式の検査では、私がしたいテキスト部分はとして
page = requests.get("http://www.peoplefinders.com/peoplesearch/searchresults?search=People&fn=joe&mn=&ln=jackson&city=&state=&age=&dobmm=&dobdd=&doby=1955") tree = html.fromstring(page.content) page.headers['Content-Type'] #'text/html; charset=utf-8' tree.xpath('//a[@class = "reporttextblue"]') #returns []
を行きます。
- IEとChromeの両方のブラウザで試しましたが、うまくいきませんでした。
- ウェブサイトは動的です。最小化または最大化すると、 html as :: beforeおよび:: afterが変更されます。
実行されているウェブサイトからの欠けているテキストがあります。
tree.xpath(「//テキスト()」)
私は誰かが背後にある本当の理由が何であるかを教えかもしれないことを願っていますこれは、Pythonを使用してそのデータをスクラップするより良い方法を教えてくれるかもしれません。
ありがとうございました
上記のページで 'class =" reporttextblue "という要素を見ることができません。 'class =" text-blue name-blue "'を意味しますか? – Andersson