2017-10-03 31 views
1

Google Cloud ML Engineを使用して、変分オートエンコーダーのハイパーパラメーターを調整しようとしています。私は自分のメインモジュール名として "trainer.task"を指定するように、ドキュメントで推奨する構造でパッケージをセットアップしました。以下は私のディレクトリ構造のイメージです。私は、以下のコマンドを使用して実行するとGoogle Cloud MLエンジンでトレーナーモジュールが見つかりません

import sys 
sys.path.append("/path/to/project/directory/") 

が、私はエラー「いいえモジュールという名前のトレーナー」を得る:私は次の行を含む場合

image of directory structure

は、これは私自身のマシン上で動作します。指定する必要がある別のパスや、Google Cloud ML Engineで実行するために必要な特別なパスがありますか?

gcloud ml-engine jobs submit training $JOB_NAME --package-path $TRAINER_PACKAGE_PATH --module-name $MAIN_TRAINER_MODULE --job-dir $JOB_DIR --region $REGION --config config.yaml 

答えて

0

setup.pyファイルはありますか?あなたはこれをデバッグするには、このissue

を打つ可能性がありますので、場合:

は、この意志出力仕事

gcloud --project=$PROJECT ml-engine jobs describe $JOB_NAME 

から

jobId: somejob 
state: PREPARING 
trainingInput: 
    jobDir: gs://BUCKET/job 
    packageUris: 
    - gs://bucket/job/packages/7d2611c7366f266058da5a9e2c93467426c5fdd018491fa33853516d9db533b1/somepackage-0.0.0.tar.gz 
    pythonModule: cifar.task 
    region: us-central1 
trainingOutput: {} 
    のようなものをパッケージのGCSの場所を取得します。
  • 上記の値は説明のためのものであり、出力とは異なることに注意してください。
  • あなたのマシンに

コピーGCSパッケージ

gsutil cp gs://bucket/job/packages/7d2611c7366f266058da5a9e2c93467426c5fdd018491fa33853516d9db533b1/somepackage-0.0.0.tar.gz /tmp 

は.tar.gzのを開梱し、それが__init__.pyファイルとtask.py.とディレクトリのトレーナーを持って確認してくださいそうでなければ、おそらくコマンドラインに不正な値を指定したでしょう。

実際のコマンドライン(変数の値)と.tar.gzの内容を含めると、おそらくもっと良い答えが得られます。

0

Jeremy私も同様の問題がありました。ファイルをダウンロードして解凍しましたが、task.pyはありませんでした。

これらは私が使用CMDライン引数です:

gcloud ml-engine jobs submit training job11 --package-path=./trainer --module- 
name='Keras_On_GoogleCloud.trainer.shallownet_train' --job-dir=gs://zubair-gc- 
bucket/jobs/job11 --region='us-central1' --config=trainer/cloudml-gpu.yaml -- - 
-job_name='zubair-gc-job11' --dataset='dataset/animals' --model='shallownet_weights1.hdf5' 
関連する問題