2016-07-28 15 views
1

HTTPエラー403:次の2つのコマンドのいずれかを使用して、禁止が生成されます。python 3:受信403:要求使用時の禁止エラー

requests.get('http://www.allareacodes.com')

urllib.request.urlopen('http://www.allareacodes.com')

しかし、私はクロームで、このウェブサイトを閲覧し、そのソースをチェックすることができています。また、cygwinのwgetもhtmlソースを取得することができます。

誰もがこのウェブサイトのソースを取得する方法を知っていますか?

答えて

1

リクエストのコードにエラーがあります。

ただし、ウェブサイトには、スクリプトが生のHTMLデータを取得しないようにする「noindex」ファイルがあります。解決策として、単純にヘッダーを偽装して、ウェブサイトがあなたが実際のユーザーだと思うようにします。

例:

import requests 
r = requests.get('http://www.allareacodes.com', headers={ 
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36" 
}) 
print(r.text) 
+0

おかげで非常に!ヘッダーオプションについては、ドキュメントをチェックします。 – user6651227

関連する問題