2016-08-09 1 views
1

最近、テンソルフローにディストリビューショントレーニングモジュールが追加されました。ディストリビュートの事前要件は何ですか?私はテンソルフローのデモを配布

tensorflow >= 0.8 kubernates shared file system, gcloud? 

、このような環境を意味するそしてそれは、サンプルコードをリリースしていた:

はtensorflowクラスタの例を実行する方法はあります、唯一のHDFSを持っているし、モデル化する任意の共有ファイルシステム、なしたときファイルストアには?

+0

あなたのご質問は、非常に短い[説明ページ](https://www.tensorflow.org/versions/r0.10/how_tos/distributed/index.html)を読んでいないと私に思います。 – Julius

答えて

1

各コンピュータにはテンソルフローがインストールされている必要があります(私の経験上、すべて同じバージョンでなければなりません)。バージョン8と9を混ぜていくつかの問題がありました。 これが設定されると、各コンピュータは実行するコードにアクセスする必要があります(たとえば、main.py)。私たちはNFSを使ってこれを共有していますが、各マシンを簡単にgitして最新のコードを入手することもできます。 その後、起動するだけです。私たちは最も基本的な設定で各マシンにsshするだけですが、kubernatesのようなクラスタがあれば、それはあなたのために異なるかもしれません。

チェックポイントに関しては、私は、主任作業者だけが、あなたの最後の質問が求めていたものであればチェックポイントファイルに書き込むと信じています。

ご質問がある場合はお知らせください。

+1

必要ならば箱から出てくる完全なデモは、今週の後半/来週の早い段階でDocumentationページに投稿できます。 –