2017-08-23 6 views
1

私はクラウドMLエンジンジョブを実行しています。私のテンソルボードプロットは、ステップ数が増えるにつれて隠れ層のゼロ値の割合が1に向かって着実に増加していることを示しています。このプロットはどのように解釈されるべきですか?ゼロ値がゼロになると、モデルが予測していることについてモデルがより確かなものになっていることが示唆されます。テンソルボードのゼロ値の分数はどのように解釈されるべきですか?

tensorboard: hidden layer fraction of zero values

答えて

3

それは一般的に、あなたの正則化技術および/または活性化関数がゼロにアクティベーションを強制されることを意味します。あなたはモデルの詳細を共有していませんが、ドロップアウトを使用する場合、特にrelu活性化関数を使用する場合は一般的です。

ゼロアクティベーションの多いモデルでは、より一般化されやすくなり、精度が向上する傾向があります。

詳細については、JMLR paper on dropoutをご覧ください。

少なくともReLUアクティベーション機能では、アクティベーションがゼロになることが悪いことがあることに注意してください。基本的に、彼らは不可逆的に「死ぬ」ことができます。だからあなたが貧しいモデルの品質を見ている場合は注意してください。詳細情報here

+0

これは非常に役に立ちます。情報をありがとう - 私は私のケースではまだドロップアウトを導入していないと思うが、私はReLUアクティベーション機能を使用しているので、この観点から考えるのは面白いです。 – reese0106

関連する問題