2016-05-08 9 views

答えて

1

あなたは平方根によってL2_1とL2_2出力を分割することができます(2)。これにより、活性化とバックプロンプトの両方が再調整されます。 ( - L2_1_t L2_1) ` と あなただけのバックプロパゲーションではなく、アクティベーションを変更したい場合は、here

+0

' L2_1_t = 1/SQRT(2)* L2_1 L2_1_y = L2_1_t + tf.stop_gradientから勾配交換トリックを使用することができます'L2_2_t = 1/sqrt(2)* L2_2 L2_2_y = L2_2_t + tf.stop_gradient(L2_2 - L2_2_t)' モデル構築コードでは、 'L2_1'の代わりに' 'L2_1_y''と' 'L2_2_y''を使用します。 L2_2(次のレイヤーへの入力として)、これは正しいのですか? – userqwerty1

+0

一見したように見えますが、試してみるとこのQを更新してください –

関連する問題