これは簡単な答えがあると確信しています!私は私の理解を向上させることを求めています。CS231N講義4バックプロップ - チェーンルール
図:の修正:カインルールがYのためのデルタを取得するために適用される場合CS231N Back Propagation
、グラデーションは次のようになります。dy = -4
を図によれば。 df/dy = df/dq * dq/dy
数値:
double x = -2;
double y = 5;
double q = 3;
double z = -4;
double f = -12;
double df = 1;
double dz = 3;
double dq = -4;
double dy = df * dq;
double dx = df * dq;
:df = df/df = 1
上記のように、とdq = df/dq = -4
を上記のようにチェーンルールの表記を適用
。従って:1(df) * -4(dq) = -4(dy)
。それとも私はこれを完全に間違っているのですか?
数値は実際にどこから来ていますか、図のどこにありますか?これはGradient Only Numericalチェーンですか、それとも他の入力値から派生していますか? 48ページ、少し混乱コード例がありますので、私は、ここに頼む理由は次のとおりです。
私は部門として、(/)記号、df/dy
で探しています、と私は、これは間違っていると思いますか? df/dy = df/dq * dq/dy
= 1/-4 * -4/-4
= 0.25 - ここでは、ある数字の目的は何ですか?それは時間に逆流つの勾配を意味し、df
のdy
を象徴する、= dy
df/dy
が、彼らは同じものであることを
ですか?
混乱を学習するための最大の問題である: