私のチームは、破損した/受け入れ可能な部品のバイナリ分類のためにTensorflowのCNNを訓練しています。 cifar10サンプルコードを変更してコードを作成しました。私の以前のニューラルネットワークの経験では、損失が0(非常に1をかなり下回る)に非常に近いまで、私はいつも訓練を受けました。しかし、トレーニング中に(別のGPU上で)検証セットを使用してモデルを評価しています。約6.7kステップ後に精度が上がらないように見えますが、40kステップを超えてもまだ低下しています。これはオーバーフィットのためですか?損失がゼロに非常に近いと、精度の点で別のスパイクが見られるはずですか?現在の最大精度は許容できません。それを殺してチューニングを続けなければなりませんか?何がお勧めですか?ここでは、トレーニングプロセスの変更されたコードとグラフを示します。ここでTensorflow:損失は減少しますが、精度は安定しています
https://gist.github.com/justineyster/6226535a8ee3f567e759c2ff2ae3776b
レイヤーを追加したり、ドロップアウトレイヤーを追加すると効果がありますか? –
最初にドロップアウトレイヤーを適用します。それが意味をなさない場合は、さらにレイヤーとドロップアウトを追加してください。フィルタのサイズを小さくしてチャンネルを増やしてみてください。 –
私たちの画像は1つのチャンネル(白黒)です。チャンネルを増やすことについてもっと説明できますか?また、フィルタの数を変更すると精度も向上すると思いますか?現在は256です。 –