私はこのページをスクレイプしようとしています:http://www.newyorkerfiction.com/Pieces.aspxと治療とセレン。私は別のページをクリックする必要がありますが、私は方法を見つけることができません。私のスクリプトは次のとおりです。java要素scrapy + seleniumをクリックしてください
def __init__(self):
self.driver = webdriver.PhantomJS(executable_path='/usr/local/bin/phantomjs')
self.driver.set_window_size(1920, 1080); #Size
def parse(self, response):
self.driver.get(response.url)
element = self.driver.find_element(By.XPATH, '//div[@class="rgWrap rgNumPart"]//a[contains(@href, "javascript:__doPostBack")]')
self.driver.execute_script("arguments[0].click();", element)
self.driver.save_screenshot('screenshot.png')
for sel in response.xpath('//body'):
item = NyfictionItem()
item["title"] = sel.xpath('//td[@class="title"]').extract()
yield item
self.driver.close()
私はexecute_scriptジャバスクリプト内の要素と対話するセレンを作ることを理解するので、私が間違っているのか理解していません。私はxpathをテストし、それは正しいようです。
アイデア?
おかげ
これは機能しました。どうもありがとう。はい、今私はもっと論理を入れなければなりません。 –