私はいくつかのプロセスをサーバー上で実行していますが、そのうちの1つはモデルをテンソルフローでトレーニングしています。定期的に、私はトレーナーに、現在のモデルを他のプロセスに送ることを望みます。私がこれを行う方法は、普通のSaver
クラスで、ディスクからsave
〜restore
までです。テンソルフローモデルをプロセス間で共有する
しかし、私はこの形式のIPCはむしろ非効率で、サーバー上でファイルシステムのロックアップを引き起こす可能性があると思います。変数をシリアル化する方法があれば、私はzmqブロードキャストパイプでそれを送ることができますが、私はこれをドキュメントで見つけられませんでした。
また、分散したテンソルフローがおそらくタスクまでありますが、それほど複雑なものは必要ないと思います。
ディスクの代わりに/ tmpfsを使用してRAMに保存するとどうなりますか? –
残念ながら、ジョブはRAMを共有しない複数の異なるノードに分散されているため、これはうまくいきません。 –