-1
私はウェブサイトthis link をクローラにしたいが、私は、コマンドにscrapyエラーはImportError:いいえモジュールという名前の項目
scrapy crawl metacritic -o metacritic.json -t json
を使用してクローラときにはImportError: No module named items
は誰も助けることができないと言いますか?
metacritic_spider.pyソース:
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
from metacritic.items import MetacriticItem
class MetacriticSpider(BaseSpider):
class MetacriticSpider(BaseSpider):
name = "metacritic" # Name of the spider, to be used when crawling
allowed_domains = ["metacritic.com"] # Where the spider is allowed to go
start_urls = ["http://www.metacritic.com/browse/games/title/pc?page=0"]
def parse(self, response):
hxs = HtmlXPathSelector(response) # The XPath selector
sites = hxs.select('//li[contains(@class, "product game_product")]/div[@class="product_wrap"]')
items = []
for site in sites:
item = MetacriticItem()
item['title'] = site.select('div[@class="basic_stat product_title"]/a/text()').extract()
item['link'] = site.select('div[@class="basic_stat product_title"]/a/@href').extract()
item['cscore'] = site.select('div[@class="basic_stat product_score brief_metascore"]/div/div/span[contains(@class, "data metascore score")]/text()').extract()
item['uscore'] = site.select('div[@class="more_stats condensed_stats"]/ul/li/span[contains(@class, "data textscore textscore")]/text()').extract()
item['date'] = site.select('div[@class="more_stats condensed_stats"]/ul/li/span[@class="data"]/text()').extract()
items.append(item)
return items
ソースitem.py:
from scrapy.item import Item, Field
class MetacriticItem(Item):
# Here are the fields that will be crawled and stored
title = Field() # Game title
link = Field() # Link to individual game page
cscore = Field() # Critic score
uscore = Field() # User score
date = Field() # Release date
私のディレクトリ構造:structure
私の構造ディレクトリ: メタクリル – beboy
私は書式設定を修正する必要があります。私はこれを変更しようとしましたが、なぜ私のレビューが受け入れられなかったのか分かりません。 – nbryans
あなたはFacebookのブライアンを持っていますか? 多分あなたはそれから答えることができます – beboy