研究論文から深いニューラルネットワークを再現しようとしています。アーキテクチャは、ここで見つけることができます:Tensorflow:入力データの準備
私はモデルの設計が完了しました、そして今私はトレーニングデータを準備しようとしています。 https://www.tensorflow.org/get_started/mnist/pros
mnistデータの場合、27x27イメージはxの1dベクトルに変換されます。一方、Y_の形状を有している[なし]、[10]各画像は、標識された10個の異なる方法の可能性、Xは計算が容易であるので、(0-9)
x = tf.placeholder(tf.float32, shape=[None, 784])
y_ = tf.placeholder(tf.float32, shape=[None, 10])
マイデータは32x32x7 3D画像であるを有するため。
x = tf.placeholder(tf.float32, shape=[None, 7168])
私の画像は32x32x7あるが、各ピクセルは、それに関連付けられた密度およびラベルを有します。密度の値がxに読み込まれ、ラベルがyに読み込まれると思います。これは正しい仮定ですか、別の方法でデータをロードする必要がありますか?
y_ = tf.placeholder(tf.float32, shape=[None, 7168])
あなたは正しいです:あなたが解決しようとしている問題は、密度を含む画像のラベルの決定であり、ラベルをワンホットエンコードした瞬間です。レスポンス変数の次元の次元はラベルの数になります(おそらく7168未満です)。 – fuglede