私はクロールしたくないです。どのようにクロールしないでください前に、データをクロールフレームワークで同じにする場合
この問題を解決するために、クロールが行われたときに、DBに日時を入力し、その日時以降にLast-Modified応答HTTPが更新されていない場合はクロールしないと思います。
私の質問は次の2つです。
- はどのようにして、より良いアイデアはありますか?この方法を考えるのですか?
- ScrapフレームワークでLast-ModifiedレスポンスHTTPコントロールを参照できるコードがある場合は教えてください。
私の質問をお読みいただきありがとうございます。
使用'Last-Modified'は良い考えです。応答ヘッダーは 'response.headers'で得ることができます。 – stamaimer