2017-05-09 3 views
0

のために必要とされるコントロールのどのレベル:はモデル訓練するためにGoogleクラウドMLを使用する場合は、Googleのクラウドミリリットル

公式の例をhttps://github.com/GoogleCloudPlatform/cloudml-samples/blob/master/census/tensorflowcore/trainer/task.pyフック、is_client、MonitoredTrainingSessionおよび他のいくつかの複雑さを使用しています。

これはcloud mlに必要ですか、この例を十分に使用していますか:https://github.com/amygdala/tensorflow-workshop/tree/master/workshop_sections/wide_n_deep

ドキュメントは、ベストプラクティスと最適化の点で少し制限されていますが、GCP MLはクライアント/ワーカーモードを処理するか、デバイスを設定する必要がありますか? replica_device_setterなど?

答えて

1

CloudML Engineは、TensorFlowプログラムの作成方法にほとんど依存しません。あなたはPythonプログラムを提供し、サービスはあなたのためにそれを実行します。environment variables(必要に応じて)分散訓練(例:タスクインデックスなど)を実行できます。

census/tensorflowcoreは、 "コア" TensorFlowライブラリ - replica_device_settersMonitoredTrainingSessionsなどの使用を含め、すべてを "ゼロから"行う方法。これはときには究極の柔軟性のために必要なこともありますが、面倒なことがあります。

国勢調査/テンソルフローコアの例に加えて、census/estimatorというサンプルもあります。この例は、残念ながらcontribにある上位レベルのライブラリに基づいているため、完全に安定したAPIをまだ持っていません(非推奨の警告などがたくさんあります)。 TensorFlowの将来のバージョンで安定することを期待してください。

特にライブラリ(Estimatorsとして知られています)は、より多くの汚い作業を世話する上位レベルのAPIです。 TF_CONFIGを解析し、replica_device_setterを設定し、MonitoredTrainingSessionと必要なHookを処理します。かなりカスタマイズ可能です。

これは、あなたが指摘した幅広く深い例が基づいており、サービスで完全にサポートされているのと同じライブラリです。

関連する問題