tf.contrib.learn.Estimator
をカスタムモデル機能で使用して、分散トレーニングを実行するモデルを取得しようとしています。Estimator用の分散カスタムモデル機能
Tensorflow documentationは、ジョブ(psおよび/またはworker)をtf.device
関数を使用してモデルに手動で配置する必要があることを指定します。ただし、このドキュメントでは、クラスとモデル関数Estimator
を使用せずに、モデルを宣言する従来の方法を参照しています。
新しいEstimator
が「モデルの訓練と評価の複雑な分散論理のほとんどを処理する」と述べたinformationが見つかりました。これは、いろいろなworker/psジョブを手動でモデルに配置する必要があることを意味しますか?そうであれば、Tensorflowの文書のコードから(例えばtf.device
を使用して)宣言する必要があります。
エスティメーターはTFに新たに追加されたもので、処理中の作業のようです。私は分散訓練のためにそれを使用する例を見つけることができませんでした、あなたがそれを有効にすることができれば、他の人がそれを見つけることができるようにここで答えを更新することができます –