Scrapy
のドキュメントを約HttpProxyMiddleware
はこのようなものですと言う:Scrapy:HttpProxyMiddlewareを書くには?
このミドルウェアは
が、それは以下の環境変数に従う:Request
オブジェクトに対してproxy
メタ値を設定することにより、要求に使用するHTTPproxy
を設定します。 Pythonの標準ライブラリモジュールurllib
とurllib2
同様http_proxy https_proxy no_proxy
あなたはまた、
http://some_proxy_server:port
またはhttp://username:[email protected]_proxy_server:port
のような値に、要求ごとのメタキープロキシを設定することができます。この値は、環境変数http_proxy/https_proxy
よりも優先され、また、環境変数no_proxy
も無視されることに注意してください。
しかしドキュメントには例がありません。
私はHttpProxyMiddleware
を書く方法がありません。
提案はありますか?
私はすでに5つのプロキシIPアドレスを持っていると仮定します。私はIPアドレスのプールを設定したい、私は何をすべきか? – zwl1619
@ zwl1619あなたのSpiderファイルにIPのLISTを作成し、それぞれの要求にランダムプロキシIPを使用してください... – Umair
私にコードを教えてください。私はそれをランダムにする方法を知らない。 – zwl1619