私はRNNを訓練していて、一晩中、損失関数がNaNに達しました。私は、これを解決するには学習率を下げることを読んでいます。私が持っている(唯一の)チェックポイントからトレーニングを再開しようとすると、より小さな学習率を使用しても、まだNaNが得られます。これは私のチェックポイントが修理を超えることを意味しますか?これを復旧する方法はありますか、それとも、tf.train.Saverを使用して、モデルのバージョンが保証されているかのように戻ってこないようにしてください。NaNの損失に達した後のチェックポイントの回復?
0
A
答えて
0
チェックポイントにNaN
という値がある場合、回復するためにできることはほとんどありません。あなたはNaNを何か他のものに置き換えることができると思いますが、それは原則ではありません。
おそらく、NaN
値のない古いチェックポイントがあるかどうかを確認したいと思うかもしれません。 tf.train.Saver
は、理由の正確この種のために、デフォルトで5つの以前のチェックポイントまで保持します。このことができます
https://www.tensorflow.org/api_docs/python/tf/train/Saver
願っています!
関連する問題
- 1. Tensorflowニューラルネットワークの損失値NaN
- 2. データ損失後にSVNを回復する
- 3. 回帰ネットワークを訓練するときのNaNの損失
- 4. ケラス:バッチ正規化を導入した後のNaNトレーニングの損失
- 5. TensorFlowの損失関数(MSE)のNaN値
- 6. Tensorflow:損失が「NaN」になる
- 7. Caffe損失のフロートマルチラベル回帰
- 8. エラー:10 $ digest()回の反復に達しました
- 9. スワップファイルを回復した後に色の罫線が失われました
- 10. ケラスカスタム損失関数を定義した後の "未知の損失関数"エラー
- 11. LSTMナンシー、ロス、セル状態、グラジエント、〜250回のトレーニング反復後にNANに行くウェイト
- 12. TensorFlow CNNの損失がNaNに急上昇する
- 13. TFLearn - 大規模なデータセットNaNの損失になる
- 14. TensorFlowの損失関数(MLP)の奇妙なNaN値
- 15. 紛失したWiredTiger.wtを回復する
- 16. 失敗後にデータを回復し、キャッシュのスキーマのバージョンが一致しない
- 17. 文字セットのために破損したデータベースデータを回復する方法
- 18. imagemagickを使用したPDFファイルの無損失回転
- 19. 更新後のデータの損失.Net TableAdapter
- 20. POST後のViewModelデータの損失
- 21. 破損したsdカードを回復する方法
- 22. eclipseで破損したワークスペースを回復する方法は?
- 23. 損失または無損失分解
- 24. Apache Spark:チェックポイントから復旧中のNPE
- 25. サブスクリプションの紛失した購入トークンを回復する
- 26. RDDをディスク上に残してエグゼキュータの損失から糸を回復する方法
- 27. スプリングバッチプロセスを正常にシャットダウンし、バッチプロセスの回復に失敗しました。
- 28. 3回の再試行後にZooKeeperが失敗しました
- 29. AESの暗号化と復号化、データの損失
- 30. Tensorflow:チェックポイント変数を分散した設定に復元する
学習率が問題だった場合、NaNが最初のエポックから多くの反復の後ではないことが予想されます。 –