tensorboard
コールバックを使用して、トレーニング履歴のtfeventsログを保存して、Google CloudのテンソルフローバックエンドのKerasを使用してconvnetモデルを実行していました。私が学習曲線を監視していたとき、私はトレーニングの途中(学習曲線が平原上にあったこと)に気づきました。新しいtfeventsログがディスクに保存されました。そして、TensorBoardの学習曲線グラフは、訓練がval_loss
であるエポック#1にリセットされ、スクラッチにもリセットされたことを示しました。Kerasは1回の.fit実行に対して複数のテンソルボードログを書き込むのはなぜですか?
これは本当に奇妙です。誰がここで何が起こっているのか知っていますか?どのような状況でKerasは自動的にトレーニングを再開し、新しいtfeventsログを保存しますか?
適合コールとカスタムコールバックの実装を表示します。 – ldavid
問題はKerasではなくGoogle Cloud MLに起因することが判明しました。 – astromz
他のユーザーがこの問題をどのように回避できるかを質問してください。 – ldavid