2017-09-17 8 views
-2

私は、BS4 & Scrapyを使用してWebページを削っています。新しいことがあるかどうかを確認する方法はありますか?もしそうなら、コピーして印刷することはできますか?
たとえば、hereは私がこの投稿を書いているようにライブです。各得点ゴールは、プレーヤーの名前、時間、サッカーボールで表され、のspanです。ページを確認するにはどうすればいいですか、2分ごとにして、誰かがゴールを決めたらプリントアウトしますか?Pythonの特定のWebページに新しいものがあるかどうかを確認するには?

答えて

1

HTTPにはヘッダLast-Modifiedがあります。 「のPythonにダイブ」でChapter 11. HTTP Web Services の大部分は、「どのようにされていないデータを取得するために」するために専用されている

Scrapy:Downloader Middleware

のドキュメントを見てください
関連する問題