1

カフェtutorial状態: - 非循環有向グラフ(DAG)正確にはcaffeは何の簿記をしていますか?

ネットは、計算グラフに接続された層の集合です。 Caffeは、前後のパスの正確性を保証するために、DAGのすべての簿記をにします。

"すべての簿記"という意味は何ですか?私はそれを理解していない。
どのようにすべての簿記を行うのですか?

答えて

1

Caffeは他の多くの深い学習フレームワークと同様に、勾配逆伝播として実装された確率的勾配傾斜(SGD)を使用してそのモデルを訓練します。すなわち、トレーニング例のミニバッチの場合、caffeはネットを介してバッチを送り(「フォワードパス」)、ネットのパラメータを使って損失を計算します。次に、損失勾配を逆方向(「逆方向パス」)に伝播させて、推定勾配に従ってすべてのパラメータを更新する。

チュートリアルでは「簿記」とは、勾配の推定やパラメータの更新を心配する必要がないことを意味します。既存のレイヤー(例:"Convolution""ReLU""Sigmoid"など)を使用すると、グラフ構造(ネットのアーキテクチャ)を定義してトレーニングデータを提供するだけで、残りのトレーニングプロセスが処理されます。各ミニバッチを前進/後退させ、損失を計算し、勾配を推定し、パラメータを更新します。
すごく素晴らしいですね。 ;)

関連する問題