Pythonを使用してページとそれに関連するすべてのリソース(イメージ、スタイルシート、スクリプトファイルなど)をダウンロードしたいと考えています。私は(やや)urllib2に精通していて、個々のURLをダウンロードする方法を知っていますが、BeautifulSoup + urllib2でハッキングを開始する前に、すでに「wget --page-requisites http://www.google.com」に相当するPythonがないことを確認したかったのです"WebページとそのすべてのリソースファイルをPythonでダウンロードする
具体的には、すべてのリソースを含め、ウェブページ全体をダウンロードするのにかかる時間に関する統計情報を収集することに興味があります。
おかげ マーク
可能な複製http://stackoverflow.com/questions/419235/anyone-know-of-a-good-python-based-web-crawler-that-i-could-use –