2017-08-05 14 views
2

何らかの理由で、私のPC(状態コード:200)から同じコードが動作しますが、Ubuntu 16.04サーバー(ステータスコード: 403)と同じPythonバージョンを実行しています。Linux上のPython Requests 403がWindowsで動作する

import requests 
session = requests.Session() 
response = session.get('https://zooqle.com/', headers={'User-Agent': 'Mozilla/5.0'}) 
print(response.status_code) 

これが起こる理由はありますか?

+0

を得るためにそれをこするWebプロキシやウェブを使用しますが、いくつかの一般的なブラウザにユーザーエージェントヘッダーを設定するようにしてください。 –

+0

ウェブスクレイピングでは、あまりにも多くの帯域幅を使用することで禁止される可能性が非常に高いです。 – o11c

答えて

0

答えはファイアウォールのアウトバウンドルールで、あなたをブロックしています。自分のコードをPython 2.7.13でUbuntu 16.04でテストし、200のステータスを受け取りました。

であなたのインバウンドとアウトバウンドのルールを確認します、あなたがあなたと比較して、Linuxのファイアウォールを修正するために私はここに投稿した

Chain INPUT (policy ACCEPT) 
target  prot opt source    destination   
ACCEPT  udp -- 0.0.0.0/0   0.0.0.0/0   udp dpt:53 
ACCEPT  tcp -- 0.0.0.0/0   0.0.0.0/0   tcp dpt:53 
ACCEPT  udp -- 0.0.0.0/0   0.0.0.0/0   udp dpt:67 
ACCEPT  tcp -- 0.0.0.0/0   0.0.0.0/0   tcp dpt:67 

Chain FORWARD (policy ACCEPT) 
target  prot opt source    destination   
DOCKER-USER all -- 0.0.0.0/0   0.0.0.0/0   
DOCKER-ISOLATION all -- 0.0.0.0/0   0.0.0.0/0   
ACCEPT  all -- 0.0.0.0/0   0.0.0.0/0   ctstate RELATED,ESTABLISHED 
DOCKER  all -- 0.0.0.0/0   0.0.0.0/0   
ACCEPT  all -- 0.0.0.0/0   0.0.0.0/0   
ACCEPT  all -- 0.0.0.0/0   0.0.0.0/0   
ACCEPT  all -- 0.0.0.0/0   192.168.122.0/24  ctstate RELATED,ESTABLISHED 
ACCEPT  all -- 192.168.122.0/24  0.0.0.0/0   
ACCEPT  all -- 0.0.0.0/0   0.0.0.0/0   
REJECT  all -- 0.0.0.0/0   0.0.0.0/0   reject-with icmp-port-unreachable 
REJECT  all -- 0.0.0.0/0   0.0.0.0/0   reject-with icmp-port-unreachable 

Chain OUTPUT (policy ACCEPT) 
target  prot opt source    destination   
ACCEPT  udp -- 0.0.0.0/0   0.0.0.0/0   udp dpt:68 

Chain DOCKER (1 references) 
target  prot opt source    destination   

Chain DOCKER-ISOLATION (1 references) 
target  prot opt source    destination   
RETURN  all -- 0.0.0.0/0   0.0.0.0/0   

Chain DOCKER-USER (1 references) 
target  prot opt source    destination   
RETURN  all -- 0.0.0.0/0   0.0.0.0/0  

:私のiptableはこのようになります

sudo iptables -L -n 

ACCEPT/REJECT要求に焦点を当てます。

+0

すべてが良いようです、私の唯一の推測は、それがVPSプロバイダによってブロックされているということです。 – user3645737

+0

これも可能です。 – k3rn3llp4n1c

+0

私はセレンウェブドライバを使って同じことを試みました。次のページでは、ウィンドウからブラウザからアクセスしたときに表示されないCAPTCHAを求めていました。 http://prntscr.com/g5gr1a 私はそれに応じて – user3645737

0

結論:ISPによってサイトがブロックされています。

解像度:必要なデータ

関連する問題