2016-12-05 21 views
4

prototxtをカフェで定義しているうちに、SoftmaxWithLossを使用する場合があります。Softmax層が入力データが各クラスに属する確率を返すことがわかっていますが、SoftmaxwithLossも返されるようですクラスの確率は、それらの違いは何ですか?または2つのレイヤータイプの使い方を誤解しましたか?CaffeのSoftmaxとSoftmaxWithLoss層の違いは何ですか?

答えて

3

SoftmaxWithLossは、予測に各対象クラスの確率を返しますが、SoftmaxWithLossはsoftmax演算を予測に適用するだけでなく、出力として返される多項ロジスティック損失を計算します。これはトレーニングフェーズにとって基本的なものです(損失なしで、ネットワークパラメータの更新に使用できる勾配はありません)。

SoftmaxWithLossLayer と詳細はCaffe Loss 参照してください。

関連する問題