ニューラルネットワークで使用するデータを準備しようとしています。そして、私はむしろすべての文書で失われています。多くのCaffeの例は、事前に準備されたデータを提供しますが、私は自分自身の準備を目指しています。私の目標は、ニューラルネットワークに入力画像(xと呼ぶ)を使い、異なる画像を出力させることです(これらをyと呼ぶことができます)。 HDF5ファイルを使用してPythonを使用してデータを保存することに決めました(私はこれを行う方法を知っています)。しかし、私は「ショー」ニューラルネットXとYしたいと、所望の出力と同様の画像のように、Yをその出力Yハットを持っています。Caffeのニューラルネットワークのデータを整理する
しかし、私は、ほとんどの畳み込みニューラルネットが、ニューラルネットに入力するための入力と望ましい出力をどのようにカプセル化しているのかはわかりません(つまり、分類ネットにどのようにデータを付けるのか)。 xとyを同じHDF5データセットに入れてから、後でCaffeデータレイヤーに入れるはずですか?もしそうなら、(x1、y1、x2、y2、...)のようなデータセットを編成するのであれば、x1、x2、...、xn、y1、y2、...、yn) 。 または、理想的な出力yと入力xを別々のデータセットにソートする必要がありますか?もしそうなら、両方をCaffeのデータレイヤーにロードできますか?
事前に感謝します。
あなたがしようとしていることに最も近い例はありますか?私は基本的な画像分類で作業しますが、私はあなたのパラダイムに翻訳することができます。 – Prune
@Prune私が考えることができる最も近いのは、CaffeのMNISTの例のような画像分類畳み込みニューラルネットと、次のような画像セグメンテーションによく使用されるピクセル単位の分類との組み合わせの一種です:http://arxiv.org/ pdf/1411.4038v2.pdfセマンティックセグメンテーションの例。私はそれが少しはっきりしていることを願っています。最後に、私は画像を読み込んで、 "注釈付き"画像を出力したい。 – Her
私はあなたの説明を正しく理解していれば、問題は変換の種類の問題に分類ソリューション(各入力を有限の与えられた選択肢の1つとしてピジョンホール)を適用しようとしていることです。モデルを訓練するためにたくさんの(x、y)ペアを入力する必要があります。モデルが訓練されたら、画像** z **を入力し、トレーニング中の** y **画像のセットにはない変換画像** z-hat **を取得します。これは正しいです?むしろ、あなたは、トレーニングがx-> yに変化するのと同じ静脈にある** z **への変更を望みます。 – Prune