私はこのリンクを擦ってしまいますが、私はそれを成功させることはできません。私は間違いがないので、私の価値は空白になります。SplashでJSページをスクラップする方法は?
私はpythonのscrapyとスプラッシュを使用しています。どうしましたか ?誰でも助けてくれますか?
この私のクモコード:
# -*- coding: utf-8 -*-
import scrapy
from scrapy_splash import SplashRequest
from boom.items import BoomItem
from scrapy.selector import HtmlXPathSelector
class OrumcekSpider(scrapy.Spider):
name = 'orumcek'
start_urls = ['example.com']
def start_requests(self):
for url in self.start_urls:
yield SplashRequest(url=url, callback=self.parse, endpoint='render.html')
def parse(self, response):
item = BoomItem()
item["BrandName"] = response.xpath("//*[@id='data-item']/div/a/span/text()").extract()
item["BrandSector"] = response.xpath("//*[@id='data-item']/div[3]/span/text()").extract()
return item
あなたの答えをありがとうございます。私はあなたが言った方法を試してみるつもりです。 –
@EmreAydınsoyレンダリングにスプラッシュやセレンを使用するとレンダリングに時間がかかるので – parik
私はこのようなものは表示されませんでした。 –