2017-03-01 24 views
0

これらのCNNの結果について私にコメントをしてください。 私は2000トレーニング画像と400テスト画像を使用しました。 トレーニングの精度は完璧ですが、テストの精度は非常に低いです。 トレーニングイメージとテストイメージの間にはかなりのバリエーションがあると思います。 このケースでは誰でも良い考えがありますか?ケラスCNNトレーニングの精度は良いですが、テストの精度は非常に低い

[Accuracy plot]

+0

おそらくstats.stackexchangeに合っていますか? – Fezvez

答えて

4

これは、オーバーフィッティングのクリアケースです。学習可能なパラメータはいくつありますか?たとえば、VGGnetには138Mのパラメータがあります。この場合、ネットワーク内の一部のニューロンが記憶されているトレーニングイメージをそのまま保持している必要があります。したがって、ネットワークが正常化していません。

まず、形状を区別するのが簡単な場合は、簡単なモデルを試すことができます。また、カラーチャンネルをスワップする(出力クラスに影響を与えない場合)、イメージを反転または回転させるなどの変換を介してトレーニングデータを増やすことで、ネットの一般化を改善できます。あなたの損失関数にL1/L2正規化を含め、ドロップアウトを試みる。

+0

「オーバーシーティング」に完全に同意し、「よりシンプルなモデル」に同意しないでください。提案したトランスフォーメーションやL1/L2などの正規化手法が必要です。他のテクニックはドロップアウトと早期停止です(編集:私にはドロップアウトを追加して、最高の結果が得られました) – Fezvez

+1

私はいくつかの研究を行いましたし、そうです、浅いモデルはより深いネットワークよりも "暗記"に敏感ですデータから階層を利用することができます。小規模なネットワークのメリットはトレーニング時間の改善だけです。 Thanxは指摘しています。私は適切に答えを編集しています – rajat

関連する問題