私はScrapingHub APIを使用していて、私のプロジェクトを展開するためにshubを使っています。ただし、アイテムが結果として示されている: - 日付、説明、リンクを公開し、>タイトル残念ながら、私は次の順序でそれを必要とするアイテム出力の順番| Scrap
。どのように出力をすべてのアイテムクラスについて正確にその順序にすることができますか?
以下は私のクモの短いサンプルです:
import scrapy
from scrapy.spiders import XMLFeedSpider
from tickers.items import tickersItem
class Spider(XMLFeedSpider):
name = "Scraper"
allowed_domains = ["yahoo.com"]
start_urls = ('https://feeds.finance.yahoo.com/rss/2.0/headline?s=ABIO,ACFN,AEMD,AEZS,AITB,AJX,AU,AKERMN,AUPH,AVL,AXPW
'https://feeds.finance.yahoo.com/rss/2.0/headline?s=DRIO
'https://feeds.finance.yahoo.com/rss/2.0/headline?s=IDXG,IMMU,IMRN,IMUC,INNV,INVT,IPCI,INPX,JAGX,KDMN,KTOV,LQMT
)
itertag = 'item'
def parse_node(self, response, node):
item = {}
item['Title'] = node.xpath('title/text()',).extract_first()
item['Description'] = node.xpath('description/text()').extract_first()
item['Link'] = node.xpath('link/text()').extract_first()
item['PublishDate'] = node.xpath('pubDate/text()').extract_first()
return item
はさらに、ここでそれは私のクモと同じ順序である、私の添付items.pyファイルなので、出力された理由を私は考えています順不同。
Items.py:
import scrapy
class tickersItem(scrapy.Item):
Title = scrapy.Field()
Description = scrapy.Field()
Link = scrapy.Field()
PublishDate = scrapy.Field()
私のコードの構文は、アイテムやクモのファイルの両方のためのオーダーであり、そして私はそれを修正する方法は考えています。私は新しいPythonプログラマーです。
外部リンクを避け、埋め込みコンテンツを好むイメージをお願いします。 –