2016-06-23 9 views
1

ニューラルネットワークで使用するデータを準備しようとしています。そして、私はむしろすべての文書で失われています。多くのCaffeの例は、事前に準備されたデータを提供しますが、私は自分自身の準備を目指しています。私の目標は、ニューラルネットワークに入力画像(xと呼ぶ)を使い、異なる画像を出力させることです(これらをyと呼ぶことができます)。 HDF5ファイルを使用してPythonを使用してデータを保存することに決めました(私はこれを行う方法を知っています)。しかし、私は「ショー」ニューラルネットXYしたいと、所望の出力と同様の画像のように、Yをその出力Yハットを持っています。Caffeのニューラルネットワークのデータを整理する

しかし、私は、ほとんどの畳み込みニューラルネットが、ニューラルネットに入力するための入力と望ましい出力をどのようにカプセル化しているのかはわかりません(つまり、分類ネットにどのようにデータを付けるのか)。 xyを同じHDF5データセットに入れてから、後でCaffeデータレイヤーに入れるはずですか?もしそうなら、(x1、y1、x2、y2、...)のようなデータセットを編成するのであれば、x1、x2、...、xn、y1、y2、...、yn) 。 または、理想的な出力yと入力xを別々のデータセットにソートする必要がありますか?もしそうなら、両方をCaffeのデータレイヤーにロードできますか?

事前に感謝します。

+0

あなたがしようとしていることに最も近い例はありますか?私は基本的な画像分類で作業しますが、私はあなたのパラダイムに翻訳することができます。 – Prune

+0

@Prune私が考えることができる最も近いのは、CaffeのMNISTの例のような画像分類畳み込みニューラルネットと、次のような画像セグメンテーションによく使用されるピクセル単位の分類との組み合わせの一種です:http://arxiv.org/ pdf/1411.4038v2.pdfセマンティックセグメンテーションの例。私はそれが少しはっきりしていることを願っています。最後に、私は画像を読み込んで、 "注釈付き"画像を出力したい。 – Her

+0

私はあなたの説明を正しく理解していれば、問題は変換の種類の問題に分類ソリューション(各入力を有限の与えられた選択肢の1つとしてピジョンホール)を適用しようとしていることです。モデルを訓練するためにたくさんの(x、y)ペアを入力する必要があります。モデルが訓練されたら、画像** z **を入力し、トレーニング中の** y **画像のセットにはない変換画像** z-hat **を取得します。これは正しいです?むしろ、あなたは、トレーニングがx-> yに変化するのと同じ静脈にある** z **への変更を望みます。 – Prune

答えて

0

私はしばらく頭の周りにこれを打ち、数人の友人からそれを打ち上げました。そして、私が今までに思いついたベストは、パラダイムに焦点を当てることです。

これは実際には複雑な予測タスクであり、分類タスクではありません。あなたが持っているものは多変量変換の一種です。私は、出力予測がNNの最後から2番目の層に対応するベクトル(線形形式の画像)または行列である(x1、y1)、(x2、y2)としてデータセットを編成したいと考えています。

+0

応答ありがとう、@プルーン!私のチームと私は、この方法を試し、私たちのハードウェアが利用可能になるとすぐにこのポストを更新します(現在進行中のテストがいくつかあります)。 – Her

+0

素晴らしい;それが助けてくれることを願っています問題は厳密な分類ではなく、変換(プロセス)を教えるように、あまりにも文字通りの方法でモデルを訓練することです。 – Prune

関連する問題