2017-08-24 11 views
0

出力レイヤーに1つのニューロンがあり、トレーニング後にNMISTデータセットから数字を直接予測できるニューラルネットワークを作成できますか?例えば、数字3を入力として与えた場合、出力層ニューロンは3に近い出力値を与えるべきである。ニューラルネットワーク - 出力レイヤー内の1つのニューロンのみでMNISTディジットを予測する

注:任意の数の隠れ層を持つニューロンがいくつあってもよい。

ありがとうございます。

これは私がTensorflowを使って試したものです。

import tensorflow as tf 
from mnist import MNIST 
import numpy as np 


inputs = tf.placeholder(tf.float32, shape=(1, 784)) 
labels = tf.placeholder(tf.float32, shape=(1, 1)) 

logits = tf.layers.dense(inputs, 1) 
loss = 9.0 * tf.sigmoid(logits) - labels # As we want predicted value in [0 - 9] 

train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss) 

init = tf.global_variables_initializer() 

with tf.Session() as sess: 
    sess.run(init) 
    mnist = MNIST() 
    for i in range(100001): 
    data, label = mnist.get_train_data() 
    lab = np.zeros((1,1), np.float32) 
    lab[0][0] = label 
    _, _loss, _logits= sess.run([train_op, loss, logits], feed_dict={inputs: np.reshape(data, (1, 784)), labels: lab}) 
    if i%5000 == 0: 
     print("Step: %d Loss: %6f <== logits %s, Actual: %6f" % (i, _loss, str(_logits), label)) 



Step: 0 Loss: -0.436195 <== logits [[ 0.02835961]], Actual: 5.000000 
Step: 5000 Loss: -6.999933 <== logits [[-11.80182171]], Actual: 7.000000 
Step: 10000 Loss: -2.999990 <== logits [[-13.7065649]], Actual: 3.000000 
Step: 15000 Loss: -4.999864 <== logits [[-11.09644413]], Actual: 5.000000 
Step: 20000 Loss: -5.000000 <== logits [[-17.01583481]], Actual: 5.000000 
Step: 25000 Loss: -2.999971 <== logits [[-12.66251564]], Actual: 3.000000 
Step: 30000 Loss: -2.999927 <== logits [[-11.72266102]], Actual: 3.000000 
Step: 35000 Loss: -0.999898 <== logits [[-11.38729763]], Actual: 1.000000 
Step: 40000 Loss: -7.000000 <== logits [[-17.59585381]], Actual: 7.000000 
Step: 45000 Loss: -3.000000 <== logits [[-17.72655296]], Actual: 3.000000 
Step: 50000 Loss: -5.000000 <== logits [[-16.65830421]], Actual: 5.000000 
Step: 55000 Loss: -6.999999 <== logits [[-15.97771645]], Actual: 7.000000 
Step: 60000 Loss: -3.000000 <== logits [[-17.10641289]], Actual: 3.000000 
Step: 65000 Loss: -4.999984 <== logits [[-13.26896667]], Actual: 5.000000 
Step: 70000 Loss: -5.000000 <== logits [[-19.57778549]], Actual: 5.000000 
Step: 75000 Loss: -2.999995 <== logits [[-14.30502892]], Actual: 3.000000 
Step: 80000 Loss: -2.999982 <== logits [[-13.13857365]], Actual: 3.000000 
Step: 85000 Loss: -0.999971 <== logits [[-12.63682747]], Actual: 1.000000 
Step: 90000 Loss: -7.000000 <== logits [[-19.08620071]], Actual: 7.000000 
Step: 95000 Loss: -3.000000 <== logits [[-19.23719406]], Actual: 3.000000 
Step: 100000 Loss: -5.000000 <== logits [[-17.85402298]], Actual: 5.000000 

答えて

1

もちろん可能ですが、それは良い考えではありません。桁認識は分類問題です。単一の出力ニューロンを使用するだけで、それを回帰問題として扱うことを提案しています。あなたが作っている暗黙の前提は、お互いに近い数字がのように見えることです。と似ています。これは明らかにそうではありません。例えば、35は、34よりも類似しています。下部は同じです。

0

@Geerthに同意しますが、ちょうど1ビットを追加します。確かに、分類の代わりに回帰モデルを使用するのは本当です。しかし、回帰モデルは入力が順序付けされていることを前提としています(1,2,3 ...または1,3,2,5,4などの順序を使用できます)。 "Introduction to Statistical Learning"本には良いアイデアがあります(無料です)。

関連する問題