とファイル私はこのスレッドで説明したようにurllibは使用してWebサイトからファイルをダウンロードしようとしています:link textダウンロードPythonのurllibは、urllib2の
import urllib
urllib.urlretrieve ("http://www.example.com/songs/mp3.mp3", "mp3.mp3")
私はファイル(主にPDFファイル)をダウンロードすることですが、私が得るすべて開くことができない破損したファイルです。私はそれがウェブサイトがログインを必要とするためだと思う。
クッキーを処理するために上記の機能をどのように変更できますか?私は既にユーザ名&のパスワード情報を持っているフォームフィールドの名前を知っています。
a, b = urllib.urlretrieve ("http://www.example.com/songs/mp3.mp3", "mp3.mp3")
print a, b
>> **cache-control:** no-cache, no-store, must-revalidate, s-maxage=300, proxy-revalida
te
>> **connection:** close
私は、ブラウザでそのURLを入力する場合は、手動でファイルをダウンロードすることができる午前:私はurlretrieveの戻り値を印刷するとき、私はのようなメッセージを取得します。ありがとう
から始まりますが、ページは、あなたが拡張+合格したファイル名で保存されます。 'mp3.mp3'の名前を' mp3.html'のように変更して、それをWebブラウザで開きます。 - これは、ログイン要求を確認するためにjsutです – ccheneson
リクエストライブラリを見てください。 urllib2を使わなければならない場合を除いて、何もしませんが、すべてを複雑にします。 http://pypi.python.org/pypi/requests –