tensorflow
を使用して、データセット上の単純な2層RNNをトレーニングします。次のようにトレーニング曲線が示されている:RNNの奇妙なトレーニング曲線をどのように解釈するのですか?
、x-axis
は(一の工程で、サンプルのbatch_size
数は正味のパラメータを更新するために使用されている)の工程で、y-axis
精度です。赤、緑、青の線は、それぞれトレーニングセット、検証セット、テストセットの精度です。トレーニングカーブが滑らかではなく、いくつかの壊れた変更をしているようです。それは妥当ですか?
お返事ありがとうございました!この実験では、固定されたbatch_size、つまり30を設定しました。そして、可変学習率を実験しようとしています。最初の実験では、上記の実験で学習率が大きすぎることが示されています。変数batch_sizesを試してみよう。 – mining