私は約20時間、7つの学習可能なレイヤーを持つ畳み込みネットワークを訓練してきました。ネットワークが収束しているか、まだトレーニングが必要かどうかを判断する一般的な方法は何ですか?ここでニューラルネットワークが収束したという証拠?
は、最初の畳み込み層のパラメータのヒストグラムです:
はここでトレーニングとテストセットの損失と精度のグラフです:
明らか私は約20時間、7つの学習可能なレイヤーを持つ畳み込みネットワークを訓練してきました。ネットワークが収束しているか、まだトレーニングが必要かどうかを判断する一般的な方法は何ですか?ここでニューラルネットワークが収束したという証拠?
は、最初の畳み込み層のパラメータのヒストグラムです:
はここでトレーニングとテストセットの損失と精度のグラフです:
明らかスコアが上がっている間(列車とテスト)、それは正しい方法であなたを意味しており、あなたはローカル/グローバルな最小値に向かっています。あなたが方向性スコアの変化を見ると(まだ倒れている、テストが上がっている)、または両方のスコアが停滞しているのを見ると、止まる時間です。
しかし
あなたはちょうどモデルのanomal振る舞いを得ることができる評価の指標としての精度を使用していますが。例:ネットワーク出力のすべての結果は、最も価値のあるクラスの数になります。 Explanation。この問題は、f1、loglossなどの評価の別の指標を使用することで解決でき、学習期間に問題が発生することがあります。
また、バランスの取れていないデータの場合は、不均衡の悪影響を回避するための戦略を使用できます。体重はsoftmax_cross_entropy in tensorflowです。実装thereを見つけることができます。
トレーニングと検証/テストの損失をプロットして、アイデアを得ることができます。 2つのグラフ間の距離が減少または一定になるまでモデルを訓練しますが、増加を開始するときは停止する必要があります。 –