私はPythonでテキストを扱っていますが、Pythonでマルチスレッドを使う方法はまだ分かっていません。テキストT_Sを生成Pythonでプログラムを並列化する
- シングルプロデューサーP(データベース/ XML):
私のユースケースは次のとおりです。
- T_sの各テキストは独立して処理することができます。処理されたテキストはT_p集合を構成する。
- 結果セットはS. 単一のスレッドでテキストファイル/ XML /データベースに書き込まれ
データ量は膨大なものであり、全ての処理は、メモリ内の現在のデータを除いて何かを続けることができませんでした。
私は次のようなプロセスを整理します:
- プロデューサーQ_sキューにテキストを置きます。
- キューからテキストを取得し、ワーカー間で配布する一連のワーカーとマネージャがあります。
- 各作業者は、処理されたテキストをQ_pに配置します。
- シンクプロセスは、Q_pから処理されたテキストを読み取り、それらを維持します。 プロデューサーそれがマネージャへの入力データソースとシンクを読み取る終了したことを通信することができなければならないこと
Beyound全。
要約。これまでに、Pyの典型的なタスクごとに素晴らしいlib/solutionがあることを知りました。私の現在の仕事には何かありますか?
Googleは「pythonワーカースレッドproducer-consumer howto」で良い結果を得ています。 http://stackoverflow.com/questions/18998520/python-threading-queue-producer-consumer-with-thread-safe –