2017-05-23 14 views
0

私はPythonでScrapyを使用してウェブサイトからデータをスクラップしています。スパイダーで掻き集めたページ数を調べるには

ウェブサイトからデータを正常に取得しましたが、スパイダーがいくつのページをスクラップしたかを知りたいと思います。

Scrapy統計は以下の通りです: enter image description here

+0

コードはどこですか? – Frrank

+0

コードを表示する必要があります。 –

答えて

3

scrapyは、ページを要求するためにrequestsを使用し、ウェブサーバーからresponsesを取得しますが、そのように分類された統計情報は有益です。

downloader/request_count: 421 
downloader/response_count: 421 
downloader/response_status_count/200: 420 
downloader/response_status_count/404: 1 

のでscrapyは421件のリクエストを行い、420回の有効な応答(コード200)を得ました。一度は応答がなかった(コード404)。

+0

詳細情報をありがとう。 –

0

420ページ。

これは、統計情報のdownloader/response_status_count/200フィールドから判断できます。

+0

ありがとうございます。 downloader/response_count:421が意味することを教えてください。 –

関連する問題