1

census tutorialに基づくMLエンジンパッケージがあり、--min-eval-frequencyフラグを使用してNステップごとに評価を実行しようとしていますが、 stackdriverログに "同じチェックポイントによる評価のスキップ..."というメッセージが表示され続ける基本的に、評価はエポックごとに1回しか発生しません(その時点でチェックポイントが最終的に変化すると思います)。チェックポイントを頻繁に更新するために必要な変更がいくつかありますか?なぜこれがより頻繁に評価されるのか?Google Cloud MLエンジン「同じチェックポイントによる評価のスキップ」

答えて

1

チェックポイントは一定の頻度で発生します。新しい評価が発生する予定があるまでに新しいチェックポイントが発生していない場合は、「同じチェックポイントによる評価のスキップ...」というメッセージが表示されます。これは、評価中にウェイトが変更されるのを避けるために、評価がフリーウェイトから別のtf.Sessionで行われる必要があるためです。これらのウェイトをセッション間で通信する唯一の方法はチェックポイントです。したがって、より頻繁に評価し、そのメッセージを受け取る場合は、チェックポイントの頻度を増やしてください。これには、tf.contrib.learn.RunConfig#save_checkpoints_stepsを入力するフラグを追加します。

関連する問題