私はpython3 urllib3を使用して複数のURLをダウンロードするクローラを構築しています。以上の同じURLを提出Python3 urllib3クローラ - 単一のドメインへの最大接続数を制限できません
def __init__(self):
self.manager = PoolManager(num_pools=20)
私が試した:私のメインの活動に
私はPoolManager
の1つのインスタンス使用しています私のDownloader
クラスの同じ(1)インスタンスを使用しての20個のスレッドを作成しますもう一度やり直してみると、ログには同じドメインへの接続が多数作成されています。プールの数を制限しようとしましたが(num_pools=1
)、同じURLに複数の接続を作成しています。ドキュメントでは、同じドメインへの他の接続が使用されている場合、PoolManager
が新しい接続を作成することを理解しました。
単一のドメインへの接続数を制限したいと考えています。最大2つの異なる接続を使用することは、通常のブラウザが使用するので安全です。どうやってやるの?