どちらを使うべきですか?チュートリアルとサンプルは、Examples/common/nn.pyのSequential([Stabilizer(), Recurrence(LSTM(hidden_dim))])
またはLSTMP_component_with_self_stabilization
のいずれかを使用します。私はchar_rnn.pyの例では前者をRecurrence(LSTM(hidden_dim, enable_self_stabilization=True))
に置き換えようとしましたが、結果はかなり悪化しています。Stabilizer()ブロックとenable_self_stabilizationパラメータの違いは何ですか?
1
A
答えて
3
Stabilizer
レイヤーは入力を学習可能なスカラーで乗算します。この簡単なトリックは、収束と安定性を大幅に改善することが示されています。 BatchNormalization
と類似点があります。一般に、BatchNormalization
を使用できる場合は、最初に試してください。それが不可能な箇所、具体的にはリカレントループの内側にある場合は、代わりにStabilizer
を使用することをお勧めします。
通常、モデルに明示的に注入する必要があります。特殊なケースは、内部にStabilizer
を含む反復ステップ関数(例えば、LSTM
)です。これを有効にするにはenable_self_stabilization=True
を使用してください。組み込みのStabilizer
は内部変数にのみ適用されます。メイン入力の場合は、自分でStabilizer
を挿入する必要があります。
明示的なStabilizer
Sを含むが(例えばdefault_option
として)enable_self_stabilization=False
を設定した場合、それらの明示的なStabilizer
sが何-OPSません。
Stabilizer
が状況を悪化させるのは私の経験ではありません。コンバージェンスを改善するのは一般的には確実なことです。しかし、それは数値の範囲を変更します。ですから、コンバージェンスが悪化する場合は、さまざまなハイパーパラメータ設定を試してみることをおすすめします。学習率を下げる。
関連する問題
- 1. Rのneuralnet:stepmaxパラメータとrepパラメータの違いは何ですか?
- 2. 静的ブロックと静的フィールドの違いは何ですか?
- 3. NSInvocationとブロックの違いは何ですか?
- 4. __repr__メソッドのselfとobjectのパラメータの違いは何ですか?
- 5. powershellのパラメータと引数の違いは何ですか?
- 6. Kotlinのプロパティとパラメータの違いは何ですか?
- 7. SSIS 2012のパラメータと変数の違いは何ですか?
- 8. Javascriptの引数とパラメータの違いは何ですか?
- 9. maven `-f`と` -pl`パラメータの主な違いは何ですか?
- 10. Tensorflow Argmax: "axis"と "dimension"パラメータの違いは何ですか?
- 11. 制限付きワイルドカードと型パラメータの違いは何ですか?
- 12. URLパラメータとクエリ文字列の違いは何ですか?
- 13. ブロックの有無によるFile.open()の違いは何ですか?
- 14. Angular5 RequestOptionsArgs検索とパラメータ違いは何ですか?以下
- 15. Perlでのパラメータ入力メカニズムの違いは何ですか?
- 16. Mantisバグの重大度クラッシュとブロックの違いは何ですか?
- 17. 同期メソッドとJavaの同期ブロックの違いは何ですか?
- 18. これらの違いのキャッシュ制御パラメータの違いは何ですか?
- 19. JasperReportsの変数、パラメータ、フィールドの違いは何ですか?
- 20. インスタンスの作成とパラメータとしてのインスタンスと作成インスタンスとの間のパラメータの違いは何ですか?
- 21. $と$$の違いは何ですか?
- 22. `##`と `hashCode`の違いは何ですか?
- 23. typedefとの違いは何ですか?
- 24. NodeJS:「./ ..」と「..」の違いは何ですか?
- 25. {}())と{})の違いは何ですか?
- 26. `&`と `ref`の違いは何ですか?
- 27. `==`と `is`の違いは何ですか?
- 28. difftimeと ' - 'の違いは何ですか?
- 29. #{} $ {}と%{}の違いは何ですか?
- 30. ⊕と+の違いは何ですか?