2012-03-02 13 views
0

私はbeautifulSoup、httpヘッダー、認証、クッキーなどの機械化について読んできました。ウェブサイトで使用されている認証を見つける方法

私はお気に入りの芸術のウェブサイトをpythonで削り取ろうとしています。私がスクレーパーを見つけた逸脱した芸術のように。今はログインしようとしていますが、試してみる基本認証コードの例は動作しません。

どのようなタイプの認証がサイトで使用されているのかを確認して、正しい方法でログインしようとしていることを知るにはどうすればよいですか?ボットをブロックしようとするときに有効なユーザエージェントのようなものを含む。

私はHTTP、Python、およびスクレイピングに慣れていないので、私の知らないことに耐えてください。

答えて

0

興味のあるサイトが基本認証を使用することはほとんどありません。あなたは、クッキーを管理する機械化のようなライブラリが必要になり、サイトのログインページにログイン情報を提出する必要があります。

+0

ありがとう私は何か助けを得ないと信じ始めていました。私は少し機械化について読んだことがありますが、それは私が混乱させてしまったので、私はそれを気にしませんでした。 PythonバージョンのMechanizeを自分の目的に使う方法についてのチュートリアルはありますか? – MotionlessMirror

+0

私はscraperwiki.comをお勧めします。彼らにはチュートリアルがあり、他の人のpython +があなたに見せるためにスクレーパーを機械化しています。 – pguardiario

関連する問題