2017-07-13 10 views
2
import requests 
import webbrowser 
from bs4 import BeautifulSoup 

url = 'https://www.gamefaqs.com' 
#headers={'User-Agent': 'Mozilla/5.0'}  
headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'} 


response = requests.get(url, headers) 

response.status_codeを設定するにもかかわらず、コーディングエラーのようですので、私は、Firefoxの/クロームを使用してウェブサイトを閲覧することができます403 を返しています。Pythonの要求 - 403は禁じられて - `ユーザーAgent`ヘッダ

私が間違いをしているのは分かりません。

ありがとうございます。

答えて

3

Sessionオブジェクトを使用してリクエストを行う場合に機能します。

import requests 

session = requests.Session() 
response = session.get('https://www.gamefaqs.com', headers={'User-Agent': 'Mozilla/5.0'}) 

print(response.status_code) 

出力:

200 
+0

感謝。差をつけている 'Session'オブジェクトではどういうことが起こっていますか?私は、サイトを掻き集める 'Session'オブジェクトを作る必要はなかった。 – Moondra

+1

@Moondraセッションオブジェクトの主なものは、Cookieとの互換性です。あなたが知っている限り、サイトが設定している可能性があり、おそらくそのポリシーに違反しているスクラップに対する防御手段としてCookieをエコーバックすることを要求している可能性があります。 –

+0

クッキー。そうですか。ありがとうございました。 – Moondra

関連する問題