requests
ライブラリを使用してウェブサイトをクロールしようとしています。しかし、私がアクセスしようとしている特定のウェブサイト(http://www.vi.nl/matchcenter/vandaag.shtml)は、非常に侵入的なcookieステートメントを持っています。リクエストライブラリを使用した侵入型Cookieステートメントのバイパス
私は次のようにウェブサイトにアクセスしようとしています:
from bs4 import BeautifulSoup as soup
import requests
website = r"http://www.vi.nl/matchcenter/vandaag.shtml"
html = requests.get(website, headers={"User-Agent": "Mozilla/5.0"})
htmlsoup = soup(html.text, "html.parser")
これは受け入れるために、大きなボタンでちょうどクッキーの文で構成されたウェブページを返します。ブラウザでこのページにアクセスしようとすると、ボタンを押すとリクエストされたページにリダイレクトされます。 requests
を使用してこれを行うにはどうすればよいですか?
私はmechanize.Browser
を使用すると考えましたが、それはかなりラウンドアバウトのやり方です。
コメントしますか? –