クラウドでモデルトレーニングを実行します。私は花のデータセットに基づいてモデルを訓練するためのサンプルコードを実行するthis linkに従っています。チュートリアルでは、4つの段階で構成されていますgoogleクラウドmlでモデルトレーニングを実行中にエラーが発生しました
予測ためのモデルを展開し、使用してクラウドステップ1と2は完了できましたが、ステップ3ではジョブは正常に送信されましたが、何らかのエラーが発生してタスクが終了ステータス1で終了します。
拡大ログのスクリーンショットは以下のとおりです。
私は、次のコマンドを使用:事前に
gcloud ml-engine jobs submit training test${JOB_ID} \
--stream-logs \
--module-name trainer.task \
--package-path trainer\
--staging-bucket ${BUCKET_NAME} \
--region us-central1 \
--runtime-version=1.2 \
-- \
--output_path "${GCS_PATH}/training" \
--eval_data_paths "${GCS_PATH}/preproc/eval*" \
--train_data_paths "${GCS_PATH}/preproc/train*"
感謝を!
はいHafizur、あなたは正しいですが、私はこの問題を解決しました。トレーニングスクリプトは私のローカルシステム上で完璧に動作していましたが、クラウドプラットフォーム上で動作させるためにスクリプトを少し変更しなければなりませんでした。 –