1

私はテンソルフローの方が新しいです。 cnnを使用してデータをトレーニングすると、最初のバッチで「トレーニング中のNaNの損失」が発生することがあります。Tensorflow CNNモデルで「トレーニング中のNaNの損失」エラーが発生する

> loss function is L1-norm 
> 
> GradientDescentOptimizer is used. 

"bach_size"、 "learning_rate" も0 = learning_rateが使用され、調整されます。

私が本当に混乱しているのは、すべてのパラメータを固定したときに結果が正常に実行され、最初のバッチでエラー「Nan」が表示されることがあります。私はそれがどうなるか知りたいですか?どのような要因が結果につながりますか?あなたのデータ内のNaNため

+0

ようこそを与えます。あなたの問題を診断するボランティアのための最善の方法は、それを再現しようとすることです。この疑問を改善するために、小さな、自己完結型で再現可能な例を提供してください。それはあまりにも多くの推測です。 –

+0

私たちはあなたのコードを持っていないので、確かに言うのは難しいです。しかし、ほとんどの場合、神経網のトレーニングには多くのランダムな要素があります。トレーニングデータはシャッフルされます。あなたの最初の重みは、ある種の分布から無作為に選ばれます。損失関数で時折NaNを取得することは大きな問題ではありませんが、損失関数がデータやネットワークにうまく適合していない可能性があります。 –

+0

Thks @ MadWombat〜あなたは、一般的にこの問題につながる可能性のある要因についての有用な情報を提供します。 – judyzha

答えて

1
  • チェック
  • RELUの活性化は時々StackOverflowのためにナン
関連する問題