Pythonの要求 - 403は禁じられて - `ユーザーAgent`ヘッダ

import requests 
import webbrowser 
from bs4 import BeautifulSoup 

url = 'https://www.gamefaqs.com' 
#headers={'User-Agent': 'Mozilla/5.0'}  
headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'} 


response = requests.get(url, headers)

response.status_codeを設定するにもかかわらず、コーディングエラーのようですので、私は、Firefoxの/クロームを使用してウェブサイトを閲覧することができます403 を返しています。Pythonの要求 - 403は禁じられて - `ユーザーAgent`ヘッダ

私が間違いをしているのは分かりません。

ありがとうございます。

出典

2017-07-13 Moondra

Sessionオブジェクトを使用してリクエストを行う場合に機能します。

import requests 

session = requests.Session() 
response = session.get('https://www.gamefaqs.com', headers={'User-Agent': 'Mozilla/5.0'}) 

print(response.status_code)

出力：

出典

2017-07-13 16:39:34

感謝。差をつけている 'Session'オブジェクトではどういうことが起こっていますか？私は、サイトを掻き集める 'Session'オブジェクトを作る必要はなかった。 – Moondra

@Moondraセッションオブジェクトの主なものは、Cookieとの互換性です。あなたが知っている限り、サイトが設定している可能性があり、おそらくそのポリシーに違反しているスクラップに対する防御手段としてCookieをエコーバックすることを要求している可能性があります。 –

クッキー。そうですか。ありがとうございました。 – Moondra

Pythonの要求 - 403は禁じられて - `ユーザーAgent`ヘッダ

答えて

関連する問題