私は単純なpythonスクリプトを書いて、ウェブサイトのページソースを表示しました。ウェブサイトはhttps://kissanime.to
です。私は以下の小さなコードを使用しています。上記のプロセスが動作していないとウェブサイトのページソースを表示できません
HTTP Error 403 : Forbidden
を次のようにエラーメッセージが表示されるが
import urllib2
url = 'https://kissanime.to'
link = urllib2.urlopen(url)
print link
iは、コミュニティにおける上記の問題を見つけ解決策を試してみましたが、この思い付きました: -
import urllib2
url = 'https://kissanime.to'
link1 = urllib2.Request(url,headers = {'User-Agent' : "Magic Browser"})
link2 = urllib2.urlopen(link1)
は、しかし、上記の方法でも失敗し、今私はエラーになっています: -
をHTTP Error 503 : Service Temporarily Unavailable
この問題の回避策はありますか?私はPythonのこのWebクローリング機能には全く新しいものです。 助けてください。
私の推測では、ユーザエージェントは、あなたの問題である - サイトがあなたをブロックしています。これはおそらく重複している:http://stackoverflow.com/questions/28396036/python-3-4-urllib-request-error-http-403 – Jeff
それでは、問題の解決方法は? –
私が提供したリンクにあります。サイトが受け入れるユーザーエージェントを指定する必要があります。 – Jeff