だけというのnoob:私は私がPythonマルチプロセッシングプールとプロセスの比較?この文脈で
for file_chunk in file_chunks:
p = Process(target=my_func, args=(file_chunk, my_arg2))
p.start()
# without .join(), otherwise main proc has to wait
# for proc1 to finish so it can start proc2
をしようとしたが、それがないように見えた
短い時間で巨大なファイルを処理できるように、複数のプロセスで一つの機能を実行しようとしています
とても速いです。
現在、私は実際にジョブを並行して実行しているのかと思います。私もプールについて考えましたが、私はpython2を使用していますが、関数に2つの引数をマップするのは醜いです。
私は上記のコードで何かが見つからないか、このように(上のように)作成されたプロセスが本当にパラレルで実行されていますか?
処理するチャンクの数はいくつですか?あなたはここに何百もの新しいプロセスを巻き込んでいますか?プールを使用すると、一定数のワーカーを作成し、システムに過負荷をかけることなく、チャンク(タスク)のセットをワーカーに分割することができます。 – svohara
@svohara私は20のチャンクしか持っていないので、このコードでは発生しない20倍の速い処理を実現することができます。 – doniyor