私は2つの入力画像を取得するネットワークを持っています。これらの2つの画像は9クラスのうち複数のクラスに属しています。 Caffeのドキュメントでは、prototxtから直接入力画像を読み込んでいますが、私はC++コードを通して情報をフィードしています。次のように損失層が見えますCaffe SigmoidCrossEntropyLossレイヤーマルチラベル分類C++
input: "data"
input_shape{dim:20 dim:6 dim:100 dim:100}
input: "class_label"
input_shape{dim:20 dim:9}
次のように
私の入力層に見える私の仮定は、入力ストリームがこの [0 0 1 0 1のように見えるべきであるということである
layer {
name: "classes"
type: "InnerProduct"
bottom: "ip2"
top: "classes"
param { lr_mult: 1 }
param { lr_mult: 2 }
inner_product_param {
num_output: 9
weight_filler { type: "xavier" }
bias_filler { type: "constant" }
}
}
layer {
name: "class_loss"
type: "SigmoidCrossEntropyLoss"
bottom: "classes"
bottom: "class_label"
top: "class_loss"
}
0 1 0 0]、ここで1は画像がクラスに属していることを意味し、0はそれがそうでないことを意味する。
私の2番目の質問は、SigmoidCrossEntropyLossレイヤーの出力(SoftmaxWithLoss出力の可能性など)から何を期待していますか?
グレートを、あなたはprototxtファイルは、この場合にどのように見えるかのサンプルを投稿することができ、その後、あなたの答えは、より完全なものになり、私はそれをマークすることができます。 –
'EuclideanLoss'層の確率分布を得ることは可能ですか? @ Shai @Poka Yoke – thigi
@thigiユークリッドの損失によって学ばれた回帰値の確率の意味は何ですか? – Shai