私はPythonでScrapyを使用してウェブサイトからデータをスクラップしています。スパイダーで掻き集めたページ数を調べるには
ウェブサイトからデータを正常に取得しましたが、スパイダーがいくつのページをスクラップしたかを知りたいと思います。
私はPythonでScrapyを使用してウェブサイトからデータをスクラップしています。スパイダーで掻き集めたページ数を調べるには
ウェブサイトからデータを正常に取得しましたが、スパイダーがいくつのページをスクラップしたかを知りたいと思います。
scrapy
は、ページを要求するためにrequests
を使用し、ウェブサーバーからresponses
を取得しますが、そのように分類された統計情報は有益です。
downloader/request_count: 421
downloader/response_count: 421
downloader/response_status_count/200: 420
downloader/response_status_count/404: 1
のでscrapy
は421件のリクエストを行い、420回の有効な応答(コード200)を得ました。一度は応答がなかった(コード404)。
詳細情報をありがとう。 –
420ページ。
これは、統計情報のdownloader/response_status_count/200
フィールドから判断できます。
ありがとうございます。 downloader/response_count:421が意味することを教えてください。 –
コードはどこですか? – Frrank
コードを表示する必要があります。 –