Scrapy Spider Webページの抽出

-1

私はpythonを使ってもWebページ（https://www.cato.org/research/34/commentary）からデータを抽出しようとしています。それは記事へのリンクを含み、その特定の記事から私は日付、著者、記事の見出しを抽出しなければなりません。そして、私はすべての記事に対して同じ操作を繰り返しています。Scrapy Spider Webページの抽出

私は、このコマンドからの文書のタイトルを抽出することができる午前：

response.css('h1.page-h1::text').extract()

をして記事のリンク従うこと：

response.css('p.text-large.experts-more-h' > a::attr(href)').extract_first()

しかし、私はすべてのリンクのためにどのように行うのですか？私はこれに新しいです。

出典

2017-09-07 Sarwar Hayatt

てみてくださいません '.extract（）' 'の代わりの.extract_first（）'あなたは一日前に同じ質問...私は.extractを試してみました@paultrmbrth –

、それを試してみてください。はいUmair私はしたが、解決策を得られなかった。本当に大事なことができたら助けてください。 – Umair

（）が、無駄に尋ねた –

for art in response.css('p.text-large.experts-more-h' > a'): 
    art.css("::attr(href)").extract_first()

出典

2017-09-07 15:33:56 Umair

Pythonファイルを手伝ってもらえますか？これは、日付と著者を抽出します。 –

Scrapy Spider Webページの抽出

答えて

関連する問題