-2
import lxml.html
import requests
l1=[]
headers= {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36'}
r = requests.get('http://www.naukri.com/jobs-by-location', headers=headers)
html = r.content
root = lxml.html.fromstring(html)
urls = root.xpath('//div[4]/div/div[1]/div/a/@href') #This xpath should give the list of cities(their links)
l1.extend(urls)
このpythonコードは、職業都市のリスト(その 'a href'タグ)を抜き取ってリストl1に格納するためのものです。しかし、ここで私は空白のリストを取得しています。同じxpathがChromeコンソールで動作していますが、このコードでは動作していません。 ..なぜこのPython Webはリクエストパッケージを使用したコードをスクレイピングしていないのですか?
http://i.stack.imgur.com/Xx1xW.jpg
コードのどの部分が機能しませんか?あなたのコードの最後に 'print l1'を追加すると、あなたのリストにURLが入力されていることが示されます。 – Mangohero1
こんにちは。理解できません。 Jupyter Qtconsoleでコードを実行すると、私には空リストが返されます! –
それは変です。私はJupyter QtConsoleに慣れていませんが、それはそれと関係があるかもしれません。 – Mangohero1