expedia.co.ukからホテルの部屋のデータをPython(2.7)で機械化(Mac)し、約1000のURL(200のホテルと5つの異なる期間)。私は、コードを実行したときPython Mechanize:ゲートウェイを開くとタイムアウトしますが、インターネットブラウザでURLが正常に開きます
が、それは最初の200のためにうまく働いた後、私は次のエラーを与えた。それ以来
httperror_seek_wrapper: Gateway Time-out
、それは常に私がエクスペディアからロードしようと何のために私は、このエラーが発生しますインターネットエクスプローラ/ Chromeから同じURLを開いても、Chromeは正常に動作します。ここで
はサンプルコードです:
import mechanize from bs4 import BeautifulSoup br = mechanize.Browser() br.set_handle_refresh(False) url = 'https://www.expedia.co.uk/Massena-Square-Hotels-Hotel-Aston-La-Scala.h53477.Hotel-Information?&rm1=a1&chkout=02/12/2016&chkin=01/12/2016' r = br.open(url, timeout = 2.0) soup = BeautifulSoup(r,'lxml')
そして、これはトレースバックです:
Traceback (most recent call last):
File "", line 5, in r = br.open(url, timeout = 2.0)
File "build/bdist.macosx-10.5-x86_64/egg/mechanize/_mechanize.py", line 203, in open return self._mech_open(url, data, timeout=timeout)
File "build/bdist.macosx-10.5-x86_64/egg/mechanize/_mechanize.py", line 255, in _mech_open raise response
httperror_seek_wrapper: Gateway Time-out
私は別のタイムアウトを試みたが、異なるIPアドレス、同じエラーを使用します。これを回避する方法はありますか?
私が使用してタイムアウトエラーを取り除くことができます
DoS攻撃を遅くする – YOU