私はスクレイピーに新しいです。私はイケアのウェブサイトのウェブページをスクラップしようとしています。場所のリストが与えられたhereの基本ページ。 マイitems.pyファイルは以下の通りである: import scrapy
class IkeaItem(scrapy.Item):
name = scrapy.Field()
link = scrapy.Field()
Scrapyを使用して特定のWebサイトからすべての外部リンクを取得したいと考えています。次のコードを使用すると、スパイダーは外部リンクもクロールします。 from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.contrib.linkextractors import LinkExtractor
from myproj