4
prototxt
をカフェで定義しているうちに、SoftmaxWithLoss
を使用する場合があります。Softmax
層が入力データが各クラスに属する確率を返すことがわかっていますが、SoftmaxwithLoss
も返されるようですクラスの確率は、それらの違いは何ですか?または2つのレイヤータイプの使い方を誤解しましたか?CaffeのSoftmaxとSoftmaxWithLoss層の違いは何ですか?
prototxt
をカフェで定義しているうちに、SoftmaxWithLoss
を使用する場合があります。Softmax
層が入力データが各クラスに属する確率を返すことがわかっていますが、SoftmaxwithLoss
も返されるようですクラスの確率は、それらの違いは何ですか?または2つのレイヤータイプの使い方を誤解しましたか?CaffeのSoftmaxとSoftmaxWithLoss層の違いは何ですか?
SoftmaxWithLoss
は、予測に各対象クラスの確率を返しますが、SoftmaxWithLoss
はsoftmax演算を予測に適用するだけでなく、出力として返される多項ロジスティック損失を計算します。これはトレーニングフェーズにとって基本的なものです(損失なしで、ネットワークパラメータの更新に使用できる勾配はありません)。
は SoftmaxWithLossLayer と詳細はCaffe Loss 参照してください。