0
Pythonリクエストモジュールを使用する(関数を取得する)私は、リンク、つまりクローラを削っています。私はスクリプトを使用して複数のリクエストを行います。私はあまりにも多くのリクエストを出していたので、GoogleはいつかリセットされたCAPTCHAに介入しました。私は時間モジュールを使用して、コードを避けるために各要求の後にしばらくの間スリープ状態にしています。私はスクリプトが眠らせるような時間が適切かどうかを知りたいので、Googleが無効なトラフィックと見なすことはありませんか? (私は大学のプロキシサーバーを使用しています)Pythonでのリクエストの間隔は?
Googleでは、異常なトラフィックを判断するために複数のパラメータを使用しています。彼らは明らかにこれらのパラメータが何かを共有していないが、私は要求の遅延が最も重要だとは思わない。 User-Agent、JS、refererはどうですか?あなたがこれらに触れなかったら、「私はボットです」と叫びます。 – leovp