2017-03-23 115 views
0

wgetをPython言語で使用してオフラインで表示できるように、コンテンツを含むWebページをどのように保存できますか?wgetをPythonで使用してWebページ(mhtml形式)をダウンロードするには

import wget 

driver.webdriver.Chrome() 
driver.get("http://www.yahoo.com") 
wget.download("http://www.yahoo.com", C:\\Users\\karanjuneja\\Downloads\\kj\\yahoo.mhtml") 

これは動作し、フォルダ内のWebページのMHTMLバージョンをstroresていますが、ファイルを開いたとき、あなただけのコードが書かれていますといないページは、それがどのように表示されるか:現在、私は次のコードを使用していますオンライン。助言がありますか? ありがとう Karan

+0

ドライバコマンドは私のためには機能しませんでしたが、私がそれらをコメントアウトしたとき、3番目のコマンドはうまくいきました。出力パスの前後に引用符を付けるだけでした。あなたが必要なときは、あなたの例に欠けているコードがありますか?私がドライバーのコマンドで受け取ったエラーは、ドライバーが認識されなかったということでした。初心者のためにwgetを使用すると、どんな助けにも感謝します。 – TMWP

答えて

0

このコードは、インターネットにアクセスしなくても表示したり閲覧できるサイトのオフラインコピーを作成するのに役立ちます。

wget --mirror --convert-links --adjust-extension --page-requisites 
--no-parent http://example.org 

--mirror - ダウンロードを再帰的に行います。

--convert-links - (CSSスタイルシートのようなものにも)すべてのリンクを相対的なものに変換するので、オフラインでの表示に適しています。

--adjust-extension - コンテンツタイプに応じてファイル名(htmlまたはcss)に適切な拡張子を追加します。

--page-requisites - オフラインでページを正しく表示するために必要なCSSスタイルシートや画像などをダウンロードします。

--no-parent - 再帰するときに親ディレクトリに上ってはいけません。ダウンロードをサイトの一部に限定するのに便利です。

私を助けてくれた彼のフォーラムにコードを提供してくれたGuy Rutenbergに感謝します。

+0

こんにちはKarthik、返事をありがとう。あなたが提供したコードをどこで実行するのか理解できません。私は上記のPythonコードでこのコードを埋め込むことができますか? –

+0

はい。それをあなたのコードに埋め込むことができます。代わりに以下のコードを使用することもできます。 wget -rの代わりに、私があなたに与えたファイルを置くことができます import os path = raw_input( "URLを入力してください") os.system( 'wget -r -nd -l1 --no-parent -A mp3 %s '%パス) –

関連する問題