2017-11-01 12 views
1

研究論文から深いニューラルネットワークを再現しようとしています。アーキテクチャは、ここで見つけることができます:Tensorflow:入力データの準備

私はモデルの設計が完了しました、そして今私はトレーニングデータを準備しようとしています。 https://www.tensorflow.org/get_started/mnist/pros

mnistデータの場合、27x27イメージはxの1dベクトルに変換されます。一方、Y_の形状を有している[なし]、[10]各画像は、標識された10個の異なる方法の可能性、Xは計算が容易であるので、(0-9)

x = tf.placeholder(tf.float32, shape=[None, 784]) 
y_ = tf.placeholder(tf.float32, shape=[None, 10]) 

マイデータは32x32x7 3D画像であるを有するため。

x = tf.placeholder(tf.float32, shape=[None, 7168]) 

私の画像は32x32x7あるが、各ピクセルは、それに関連付けられた密度およびラベルを有します。密度の値がxに読み込まれ、ラベルがyに読み込まれると思います。これは正しい仮定ですか、別の方法でデータをロードする必要がありますか?

y_ = tf.placeholder(tf.float32, shape=[None, 7168]) 
+0

あなたは正しいです:あなたが解決しようとしている問題は、密度を含む画像のラベルの決定であり、ラベルをワンホットエンコードした瞬間です。レスポンス変数の次元の次元はラベルの数になります(おそらく7168未満です)。 – fuglede

答えて

1

私の画像は32x32x7あり、各画素は、それに関連する密度およびラベルを有する

もしそうであれば、ネットワークの出力、および目標y_、形状であろう。

[ 
None,   # Batch size 
32 * 32 * 7, # Vector size 
N    # N target labels (one hot encoded) 
] 
+0

また、あなたが提供したソリューションでは、これは各入力イメージに1つのラベルしかないことを意味しますか?私は各入力画像が7168個のラベル(各ピクセルごとに1個のラベル)を取得するという印象を受けていました。 –

+1

@DevinHaslam各ピクセルには、可能なラベルがN個あります。 W = tf.Variable(tf.zeros [7168,7168,10(x、W、axes = [[1]、[1]]) ]) 'と' L = tf.Variable(tf.zeros([7168、10])) 'となります。 –

+0

残念ながら、「W = ...」の後に「function」オブジェクトがサブスクリプトでないと言うエラーが発生します。 –

関連する問題