いくつかのウェブサイトを保存するときに、Firefoxで「ファイル」をクリックしてから「ページを別名で保存」するのにうんざりしています。FirefoxのようなWebサイトを保存するためのPythonスクリプトはありますか?
Pythonでこれを行うスクリプトはありますか?私は画像とCSSファイルを保存して、オフラインで読むと正常に見えるようにしたいと思います。
いくつかのウェブサイトを保存するときに、Firefoxで「ファイル」をクリックしてから「ページを別名で保存」するのにうんざりしています。FirefoxのようなWebサイトを保存するためのPythonスクリプトはありますか?
Pythonでこれを行うスクリプトはありますか?私は画像とCSSファイルを保存して、オフラインで読むと正常に見えるようにしたいと思います。
Cobbalがこれを行うために設計されているものwgetの大部分であると述べたようにあなたはwgetの-m -k -E [URL]
-E, --html-extension save HTML documents with `.html' extension.
-m, --mirror shortcut for -N -r -l inf --no-remove-listing.
-k, --convert-links make links in downloaded HTML point to local files.
恐らくwgetのようなツールは、このタイプのものでより適切です。
これはPythonの答えではありません。あなたのマシンが実行されているかどうかわかりませんが、wgetなどのsite ripperを使用することを検討していますか?
import os
cmd = 'wget <parameters>'
os.system(cmd)
をwgetの
を使用することができます。私は、ページ全体、CSS +をダウンロードするように設定できるいくつかのフラグ/引数があると信じています。私はちょうどエイリアスを入力するのがより便利なものにするか、または簡単なスクリプトに投げることをお勧めします。
あなたはHTTrackを見ましたか?
ありがとうございました。これが最も役に立ちましたが、「-p」フラグが必要なものであることがわかりました。 "wget -k -p www.google.com" – Unknown
wgetはJavaScriptとCSSのURIを変換できないことに注意してください。 ''や 'background:url(http:// host。 tld/images/image.png) 'である。 –