私は分散コードに挑戦し始めており、そこにあるすべてのものに基づいて自分のニーズに合った解決策を見つけ出すことができません。基本的に私は単一の関数で処理する必要のあるデータのpythonリストを持っています。この関数は、いくつかのforループをネストしていますが、リスト上の各項目に対して長時間(約1分)かかることはありません。私の問題はリストが非常に大きいことです(3000以上のアイテム)。私はマルチプロセッシングを検討していますが、マルチサーバーの処理を試してみたいと思います(データが大きくなると、ジョブを実行するためにサーバーを増やすことができれば理想的です) 。パイソンデータ/コードをワーカーノードに配布するための提案?
だから私の質問は、どのようなパッケージができます私は基本的に私がしてこのデータリストを配布することができます何かを探して(スーパー必要ないと私はまた、このを通じて私のコードベースを配布することができれば、それはいいだろう)私はこれを達成するために使う?私のデータベースはhbaseなので、すでにhadoopが稼働しています(hadoopは使用されていませんが、データベース用です)。私はセロリを見て、ひねりましたが、私のニーズに合うものは混乱しています。
提案がありますか?