関数から値を渡そうとしています。複数のサイトから値を取得する
私はドキュメントを調べて、それを理解できませんでした。 REF:ここ
def parse_page1(self, response):
item = MyItem()
item['main_url'] = response.url
request = scrapy.Request("http://www.example.com/some_page.html",
callback=self.parse_page2)
request.meta['item'] = item
yield request
def parse_page2(self, response):
item = response.meta['item']
item['other_url'] = response.url
yield item
は私がachiveしたいのpsudoコードです:
import scrapy
class GotoSpider(scrapy.Spider):
name = 'goto'
allowed_domains = ['first.com', 'second.com]
start_urls = ['http://first.com/']
def parse(self, response):
name = response.xpath(...)
price = scrapy.Request(second.com, callback = self.parse_check)
yield(name, price)
def parse_check(self, response):
price = response.xpath(...)
return price
両方のサイトからの情報を含む1つのアイテムが必要ですか?サイトごとに1つのアイテムが必要ですか? – eLRuLL
いいえ、私はすべての変数を含むオブジェクトを望んでいません、私は異なるvarsが欲しいです。それが不可能で、私がしなければならない場合は、1つのオブジェクト。 – daniel