0
私は多くの特殊なWebスクレイパーのレガシーコードベースを持っていますが、最後にsleep
ステートメントを使ってwhile True
を実行して、Webサーバーへの同期要求を行っています。このコードベースはPython 2に含まれており、Python 3に移行してPython 3の非同期機能を利用することはできません。理想的にはPython 2の非同期の複数のWebスクレイパー
私は(Pythonの2)以下の
- 非同期Webリクエスト
- 非同期は、CSVへの書き込みをフィーチャーした、単一のパイプラインとして多くの個々のWebスクレイピングスクリプトのこのセットを書き換えたいのですが
- ノンブロッキング
sleep
各ページが設定された頻度で削られるようにするステートメント
これはPython 3の簡単な問題のようですeasyncio
とコルーチンが一般的です。誰かがこれをやる方法を教えてください/ Python 2でこれを行うためのいくつかの参考資料。
ありがとうございます。
スレッドモジュールhttps://docs.python.org/2/library/threading.htmlが参考になります。スレッドごとに別々のファイルに書き込んで、すべてのスレッドが終了した後に結合することができます。 – rlee827