python 3：受信403：要求使用時の禁止エラー

HTTPエラー403：次の2つのコマンドのいずれかを使用して、禁止が生成されます。python 3：受信403：要求使用時の禁止エラー

requests.get('http://www.allareacodes.com')

urllib.request.urlopen('http://www.allareacodes.com')

しかし、私はクロームで、このウェブサイトを閲覧し、そのソースをチェックすることができています。また、cygwinのwgetもhtmlソースを取得することができます。

誰もがこのウェブサイトのソースを取得する方法を知っていますか？

出典

2016-07-28 user6651227

リクエストのコードにエラーがあります。

ただし、ウェブサイトには、スクリプトが生のHTMLデータを取得しないようにする「noindex」ファイルがあります。解決策として、単純にヘッダーを偽装して、ウェブサイトがあなたが実際のユーザーだと思うようにします。

例：

import requests 
r = requests.get('http://www.allareacodes.com', headers={ 
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36" 
}) 
print(r.text)

出典

2016-07-28 19:03:51 DeadCake

おかげで非常に！ヘッダーオプションについては、ドキュメントをチェックします。 – user6651227

python 3：受信403：要求使用時の禁止エラー

答えて

関連する問題