カフェtutorial状態: - 非循環有向グラフ(DAG)正確にはcaffeは何の簿記をしていますか?
ネットは、計算グラフに接続された層の集合です。 Caffeは、前後のパスの正確性を保証するために、DAGのすべての簿記をにします。
"すべての簿記"という意味は何ですか?私はそれを理解していない。
どのようにすべての簿記を行うのですか?
カフェtutorial状態: - 非循環有向グラフ(DAG)正確にはcaffeは何の簿記をしていますか?
ネットは、計算グラフに接続された層の集合です。 Caffeは、前後のパスの正確性を保証するために、DAGのすべての簿記をにします。
"すべての簿記"という意味は何ですか?私はそれを理解していない。
どのようにすべての簿記を行うのですか?
Caffeは他の多くの深い学習フレームワークと同様に、勾配逆伝播として実装された確率的勾配傾斜(SGD)を使用してそのモデルを訓練します。すなわち、トレーニング例のミニバッチの場合、caffeはネットを介してバッチを送り(「フォワードパス」)、ネットのパラメータを使って損失を計算します。次に、損失勾配を逆方向(「逆方向パス」)に伝播させて、推定勾配に従ってすべてのパラメータを更新する。
チュートリアルでは「簿記」とは、勾配の推定やパラメータの更新を心配する必要がないことを意味します。既存のレイヤー(例:"Convolution"
、"ReLU"
、"Sigmoid"
など)を使用すると、グラフ構造(ネットのアーキテクチャ)を定義してトレーニングデータを提供するだけで、残りのトレーニングプロセスが処理されます。各ミニバッチを前進/後退させ、損失を計算し、勾配を推定し、パラメータを更新します。
すごく素晴らしいですね。 ;)