2016-07-20 18 views
12

私はsiteを解析する必要がありましたが、私は403 Forbiddenというエラーが発生しました。Pythonリクエスト。 403 Forbidden

url = 'http://worldagnetwork.com/' 
result = requests.get(url) 
print(result.content.decode()) 

その出力:ここ はコードである

<html> 
<head><title>403 Forbidden</title></head> 
<body bgcolor="white"> 
<center><h1>403 Forbidden</h1></center> 
<hr><center>nginx</center> 
</body> 
</html> 

、問題が何であるか言ってください。

答えて

38

User-Agentを識別しないGETリクエストをページが拒否したようです。私はブラウザ(クローム)のページを訪問しGETリクエストのヘッダUser-Agent(開発者向けツールのネットワークタブで見て)コピー:

import requests 
url = 'http://worldagnetwork.com/' 
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'} 
result = requests.get(url, headers=headers) 
print(result.content.decode()) 

# <!doctype html> 
# <!--[if lt IE 7 ]><html class="no-js ie ie6" lang="en"> <![endif]--> 
# <!--[if IE 7 ]><html class="no-js ie ie7" lang="en"> <![endif]--> 
# <!--[if IE 8 ]><html class="no-js ie ie8" lang="en"> <![endif]--> 
# <!--[if (gte IE 9)|!(IE)]><!--><html class="no-js" lang="en"> <!--<![endif]--> 
# ... 
+0

はどうもありがとうございましたを! –

+0

私のために働いた、ありがとうu –

+0

私はなぜそのエラーが私のためにポップアップを始めた、それは数時間前に働いていた理解しない。しかし、ソリューションは完璧に働いた、ありがとう! – rodrigorf