0

Google CloudのMLエンジンで大規模な分散型テンソルフローモデルを実行しようとしていますが、何が起こるべきか理解できていません。tf.train.ClusterSpecGoogle Cloud MLエンジンでDistributed Tensorflowを実行するClusterSpec

Googleクラウドでジョブを実行するときは、BASIC、STANDARD_1、PREMIUM_1、BASIC_GPUまたはCUSTOMからscale tierを選択して、それぞれ異なるタイプのクラスタにアクセスできます。しかし、私はこれらのクラスター内のマシンの名前/アドレスを見つけることができません。

答えて

0

ドキュメントとサンプルhereをご覧ください。環境変数TF_CONFIGを使用してClusterSpecを設定する必要があります。例えば

tf_config = os.environ.get('TF_CONFIG') 

    # If TF_CONFIG is not available run local 
    if not tf_config: 
    return run('', True, *args, **kwargs) 

    tf_config_json = json.loads(tf_config) 
    cluster = tf_config_json.get('cluster') 
    ... 
    cluster_spec = tf.train.ClusterSpec(cluster) 
+0

ありがとう、これは私が探していたものです。 – Miguel

関連する問題