2017-12-03 14 views
0

実際にテンソルフローでモデルの並列性を自動的に実装したいと考えています。Tensorflowモデルの並列性エラー

バージョン1.3のプレースメントコード(simple_placer.cc)のテンソルフローのコードを少し修正します。しかし、配置はMNISTの場合には機能していましたが、開始時にエラーがあります。

InvalidArgumentError (see above for traceback): Trying to access resource located in device /job:worker/replica:0/task:1/cpu:0 from device /job:worker/replica:0/task:0/cpu:0 

私はこのようなエラーが立ち上がるか、このエラーを作るものが条件ときのように、このエラーに関するいくつかのアドバイスを取得したいです。

ありがとうございました。

答えて

0

このエラーは、通常、入力の1つを読み込もうとしたときに発生しますが、その入力は別のデバイスに存在します。通常、テンソルフローが異なるデバイスに操作を配置するとき、send/recvノードを実行グラフに挿入して、これらのデバイス間のテンソルを交換します。変更によって、そのロジックの一部が壊れている可能性があります。

+0

私の質問にお答えいただきありがとうございます。入力ノードがマシン1(M1)にあり、M1、M2などでデータが分離されている場合があります。入力ノードがM1にあるデータにアクセスするとエラーは発生しませんが、入力ノードがM2や他のマシンのデータでは、私が言及したエラーが発生するでしょうか? – jwl1993

+0

はい、そうです。 – iga

+0

次に、入力データを持つすべてのマシンに入力ノードに対応するrecv/sendノードを追加する方法はありますか? – jwl1993

関連する問題