私はクラウドMLエンジンジョブを実行しています。私のテンソルボードプロットは、ステップ数が増えるにつれて隠れ層のゼロ値の割合が1に向かって着実に増加していることを示しています。このプロットはどのように解釈されるべきですか?ゼロ値がゼロになると、モデルが予測していることについてモデルがより確かなものになっていることが示唆されます。テンソルボードのゼロ値の分数はどのように解釈されるべきですか?
1
A
答えて
3
それは一般的に、あなたの正則化技術および/または活性化関数がゼロにアクティベーションを強制されることを意味します。あなたはモデルの詳細を共有していませんが、ドロップアウトを使用する場合、特にrelu活性化関数を使用する場合は一般的です。
ゼロアクティベーションの多いモデルでは、より一般化されやすくなり、精度が向上する傾向があります。
詳細については、JMLR paper on dropoutをご覧ください。
少なくともReLUアクティベーション機能では、アクティベーションがゼロになることが悪いことがあることに注意してください。基本的に、彼らは不可逆的に「死ぬ」ことができます。だからあなたが貧しいモデルの品質を見ている場合は注意してください。詳細情報here。
関連する問題
- 1. パイロットヒストグラムビンはどのように解釈されますか?
- 2. JavaScriptはどのように解釈されますか?
- 3. xmlの空ノードタグはどのように解釈され、ノードの存在は解釈されませんか?
- 4. このマクロをどのように解釈できますか?
- 5. プロパティベースのテストコードをどのように解釈できますか?
- 6. @Dataのような別の注釈にLombok注釈を因数分解する
- 7. 分割するポイントがないコンソール値を解釈するにはどうすればよいですか?
- 8. これらのテンプレート引数はどのように解釈され使用されますか?
- 9. これはどのように解釈されますか?obj1.getPrev()。setNext(obj2);
- 10. どのように各ループを解釈するのですか?
- 11. fio iopsのログファイルはどのように解釈されますか?
- 12. QPainterPath :: arcToの角度はどのように解釈されますか?
- 13. ImageMagickの "S字状のコントラスト"はどのように解釈できますか?
- 14. スマートポインタはどのようにキャストダウンされるべきですか?
- 15. ルアでは、数値が別の数値に均等に分割されているかどうかをどのように判断できますか?
- 16. PHPマクロ定義はどのように解釈されますか?
- 17. jqueryセレクタ、 "a + b + c + d"はどのように解釈されますか
- 18. 平方根プログラムはどのように解釈されますか
- 19. ブラウザはCSSをどのように解釈し、どのように処理されますか?
- 20. Pythonですべての負の数をゼロに変更するにはどうすればよいですか?
- 21. 離散分布のヒストグラムをテンソルボードにプロットするにはどうすればよいですか?
- 22. Node.jsで非同期のJavaScriptがどのように解釈されて実行されるのですか?
- 23. sparsennの出力をどのように解釈すればよいですか?
- 24. numpy.fft.rfft2の出力をどのように解釈すればよいですか?
- 25. glewinfoの出力をどのように解釈すればよいですか?
- 26. 負の調整されたrandインデックスはどのように解釈できますか?
- 27. ゼロ引数の関数として解釈される値を持つ値による呼び出しと名前による呼び出し
- 28. シェルスクリプト内で変数をその場で解釈するにはどうすればよいですか?
- 29. マシンはバイナリをどのように解釈しますか?
- 30. ジュリアは10:1をどのように解釈しますか?
これは非常に役に立ちます。情報をありがとう - 私は私のケースではまだドロップアウトを導入していないと思うが、私はReLUアクティベーション機能を使用しているので、この観点から考えるのは面白いです。 – reese0106