2017-09-07 25 views
-1

私はpythonを使ってもWebページ(https://www.cato.org/research/34/commentary)からデータを抽出しようとしています。それは記事へのリンクを含み、その特定の記事から私は日付、著者、記事の見出しを抽出しなければなりません。そして、私はすべての記事に対して同じ操作を繰り返しています。Scrapy Spider Webページの抽出

私は、このコマンドからの文書のタイトルを抽出することができる午前:

response.css('h1.page-h1::text').extract() 

をして記事のリンク従うこと:

response.css('p.text-large.experts-more-h' > a::attr(href)').extract_first() 

しかし、私はすべてのリンクのためにどのように行うのですか?私はこれに新しいです。

+0

てみてくださいません '.extract()' 'の代わりの.extract_first()'あなたは一日前に同じ質問...私は.extractを試してみました@paultrmbrth –

+0

、それを試してみてください。はいUmair私はしたが、解決策を得られなかった。本当に大事なことができたら助けてください。 – Umair

+0

()が、無駄に尋ねた –

答えて

1

for art in response.css('p.text-large.experts-more-h' > a'): 
    art.css("::attr(href)").extract_first() 
+0

Pythonファイルを手伝ってもらえますか?これは、日付と著者を抽出します。 –

関連する問題