は、私は2つの機能がトーチの後方伝播のために知っていると私はgradInput
とgradOutput
は本当に層に何を意味するかについて混乱してい updateGradInput(input, gradOutput) accGradParameters(input, gradOutput, scale)
を次のようにインターフェースがあります。 ネットワークのコストがC
であり、レイヤーがL
であるとします。層L
のgradInput
とgradOutput
の平均値はd_C/d_input_L
とd_C/d_output_L
ですか?トーチのupdateGradInputとaccGradParametersを書き込む方法は?
もしそうなら、gradInput
の計算方法はgradOutput
ですか?
なお、accGradParameters
は、d_C/d_Weight_L
とd_C/d_bias_L
が累積することを意味しますか?もしそうなら、これらの値を計算する方法は?
ありがとうございます。あなたの答えは私の混乱にぴったりです。 –