NYU深度v2データセットを使用して単一の画像から深さを推定できるCNNを実装する予定です。このチュートリアルでは、Caffeの分類問題を扱うCNNを実装するのは簡単だということがわかりました。私はCaffeが多次元的な地面の真理(例えば奥行き画像)と回帰(深さの推定)を含むタスクに適しているかどうかが不思議です。Caffeの多次元ラベルデータ
私が達成したいのは、奥行き画像を推定することができるCNNを訓練するための奥行き画像として奥行き画像を使用することです。ラベルを単一チャンネルの画像データとして読み込む必要があります。
私は、私は2つのトップ層、グラウンドトゥルースとしての奥行きデータの入力用とその他を定義する必要があることを理解し、私の問題https://groups.google.com/d/msg/caffe-users/JXmZrz4cCMU/mBTU1__ohg4J
に関連しているShelhamerことで、この答えを見つけることができます。次に、損失層(EucledianLossなど)を使用して損失を計算することができます。私は以下のモデルを追加しました。
このモデルは意図したとおりに動作しますか?もしそうでなければ、Caffeでそれを行う他の方法はありますか?
layer {
name: "data"
type: "ImageData"
top: "data"
image_data_param {
source: "input_set.txt"
batch_size: 50
}
}
layer {
name: "label"
type: "ImageData"
top: "label"
image_data_param {
source: "depth_set.txt"
batch_size: 50
}
is_color: false
}
layer {
name: "loss"
type: "EuclideanLoss"
bottom: "some_output_layer_name"
bottom: "label"
top: "loss"
}
あなたの結果は達成されましたか?私は同じことを試みてきました。しかし私は自分の問題を解決するネットワークを作り出すことができませんでした。 – thigi