0
私は深い学習のためにcaffeを使用していますが、python softmaxwithlossレイヤーを作ろうとしています(おそらく意味がありませんが、試したいと思っています)。問題は私のレイヤーがトレーニングフェーズの後ろのセクションで動作しないことです(データにNANを持っています)。about caffe python API
質問:どのようにカフェ後方トレーニングのために働くのですか?すべての層がそのdiff(caffe.Layer [0] .diffなど)を学習し、それを次の層に伝えますか?だから、唯一行うべきことは、下位層の差分を計算して後退させることです。
感謝