2017-03-23 6 views
0

私はここに提供される例をしようとしていた:労働者としてサーバーや他のとして働い1: https://github.com/ischlag/distributed-tensorflow-example 私は2台のマシンを持っています。まだからの応答を待っ193]のCreateSession:Distrubuted TensorFlow:まだ労働者からの応答を待っているのCreateSession:/仕事:PS /レプリカ:0 /タスク:0

変数を初期化... 私は/コア/ distributed_runtime/master.ccをtensorflow:私は次のエラーを取得しています

(両方のマシン上のバージョンは1.0.1です)タスク/ジョブ:0 /タスク:0 テンソルフロー/コア/ distributed_runtime/master.cc:193] CreateWorkはワーカーからの応答をまだ待っています:/ job:worker/replica:0/task:1 Iタスクを実行している間に、タスクが実行されていないことを確認します。テンソルフロー/コア/ distributed_runtime/master.cc:193] CreateSessionはまだワーカーからの応答を待っています:/ job:worker/replica:0/task:2

+0

あなたは、IPS/'parameter_servers = [ "PC-01:2222"]内のポート設定している\t、 労働者= [\t "PC-02:2222"、 \t \t \t "2222 PC-03" \t \t "pc-04:2222"] '? – Himaprasoon

+0

はい。 pc-01 - >はipアドレス – user3663496

+0

のIPポートの組み合わせです。 localhost:2222 localhost:2223など – Himaprasoon

答えて

0

私は、 o第3ノードをマスタとしてClusterSpecに追加して修正します。私は同じ問題を抱えていた、とデバッグの数時間後、私はcluster_specの順序が間違っていたために問題があることがわかった

TF_CONFIG = { 
     'cluster' : { 
      'master' : [ master_node01:2222 ], 
      'ps' : [ps_node01:2222, ...] 
      'worker' : [worker_node01:2222, ...]} 
     'environment' : 'cloud', 
     'task': {'type': current_task, 'index': current_index}} 
0

:マイTF_CONFIG環境変数は次のように見えます。 task_indexがps/workerリストと一致しませんでした。注文を変更した後、修正されました。

関連する問題