Tensorflow：入力データの準備

研究論文から深いニューラルネットワークを再現しようとしています。アーキテクチャは、ここで見つけることができます：Tensorflow：入力データの準備

私はモデルの設計が完了しました、そして今私はトレーニングデータを準備しようとしています。 https://www.tensorflow.org/get_started/mnist/pros

mnistデータの場合、27x27イメージはxの1dベクトルに変換されます。一方、Y_の形状を有している[なし]、[10]各画像は、標識された10個の異なる方法の可能性、Xは計算が容易であるので、（0-9）

x = tf.placeholder(tf.float32, shape=[None, 784]) 
y_ = tf.placeholder(tf.float32, shape=[None, 10])

マイデータは32x32x7 3D画像であるを有するため。

x = tf.placeholder(tf.float32, shape=[None, 7168])

私の画像は32x32x7あるが、各ピクセルは、それに関連付けられた密度およびラベルを有します。密度の値がxに読み込まれ、ラベルがyに読み込まれると思います。これは正しい仮定ですか、別の方法でデータをロードする必要がありますか？

y_ = tf.placeholder(tf.float32, shape=[None, 7168])

あなたは正しいです：あなたが解決しようとしている問題は、密度を含む画像のラベルの決定であり、ラベルをワンホットエンコードした瞬間です。レスポンス変数の次元の次元はラベルの数になります（おそらく7168未満です）。 – fuglede

私の画像は32x32x7あり、各画素は、それに関連する密度およびラベルを有する

もしそうであれば、ネットワークの出力、および目標y_、形状であろう。

[ 
None,   # Batch size 
32 * 32 * 7, # Vector size 
N    # N target labels (one hot encoded) 
]

2017-11-01 18:00:18

また、あなたが提供したソリューションでは、これは各入力イメージに1つのラベルしかないことを意味しますか？私は各入力画像が7168個のラベル（各ピクセルごとに1個のラベル）を取得するという印象を受けていました。 –

@DevinHaslam各ピクセルには、可能なラベルがN個あります。 W = tf.Variable（tf.zeros [7168,7168,10（x、W、axes = [[1]、[1]]） ]） 'と' L = tf.Variable（tf.zeros（[7168、10]）） 'となります。 –

残念ながら、「W = ...」の後に「function」オブジェクトがサブスクリプトでないと言うエラーが発生します。 –

答えて