私はlxmlとxpathsについてよく知らないので、ウェブサイトからデータをスクラップする方法を学びたいと思っています。私がこのコードを実行すると、結果が得られず、理由もわかりません。それを修正するのを助けてください。ここlxmlのpythonを使用してウェブサイトからのURLとテキストをこする
コード
from lxml import html
import requests
pageLen=str(100)
page = requests.get('http://www.yellowpages.com/search?search_terms=lawyer&geo_location_terms=usa&page=2')
print(page)
tree = html.fromstring(page.content)
#phoneNumber = tree.xpath('//span[@class="c411Phone"]/text()')
Link=tree.xpath('//div[@class="info"]/a/@href')
Bname=tree.xpath('//a[@class="business-name"]/text()')
print(Bussiness_names)
print(Bname)
HTMLコード
美しいスープを使用したことはありますか? http://www.pythonforbeginners.com/python-on-the-web/web-scraping-with-beautifulsoup/ –
私は美しい石鹸を試していませんでした。 lxmlを使ってリンクを抽出できないのですか? – Ibraham
どのように動作するかわからない場合は、xpathsについて学び、lxmlのドキュメントを読む必要があります。 –