2016-10-21 10 views
6

私は、数字の画像を描き、それがMNISTで訓練されたモデルでどの桁であるかを判別できるスクリプトを書こうとしています。ここでTensorflow - 私自身の画像でムービーニューラルネットワークをテストする

は私のコードです:

import random 
import image 
from tensorflow.examples.tutorials.mnist import input_data 
import tensorflow as tf 
import numpy as np 
import scipy.ndimage 

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True) 


x = tf.placeholder(tf.float32, [None, 784]) 
W = tf.Variable(tf.zeros([784, 10])) 
b = tf.Variable(tf.zeros([10])) 

y = tf.nn.softmax(tf.matmul(x, W) + b) 
y_ = tf.placeholder(tf.float32, [None, 10]) 

cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1])) 

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy) 

init = tf.initialize_all_variables() 

sess = tf.Session() 
sess.run(init) 

for i in range(1000): 
    batch_xs, batch_ys = mnist.train.next_batch(1000) 
    sess.run(train_step, feed_dict= {x: batch_xs, y_: batch_ys}) 

print ("done with training") 


data = np.ndarray.flatten(scipy.ndimage.imread("im_01.jpg", flatten=True)) 

result = sess.run(tf.argmax(y,1), feed_dict={x: [data]}) 

print (' '.join(map(str, result))) 

結果は常に間違っているが、私は、標準的な試験方法を使用する際に92%の精度を持っているいくつかの理由。

私は、問題は、私は画像エンコード方法かもしれないと思う。私は、彼らはそれをやったかを確認するためにthe next_batch() functionためtensorflowコードで探してみましたが、私は私と比較することができますか見当がつかない

data = np.ndarray.flatten(scipy.ndimage.imread("im_01.jpg", flatten=True)) 

をアプローチ。

問題は別の場所にある可能性があります。

精度を80%向上させる助けがあれば、大歓迎です。

+1

イメージエンコードに関しては、.pngを使用してみてください。私のテストから、画像にアーティファクト(灰色のピクセル)を残す限り、.jpg形式は悪いです。 – Link

答えて

6

私は私のミスを見つけた:それは逆にエンコードされ、ブラックはそれを修正255の代わりに、0

data = np.vectorize(lambda x: 255 - x)(np.ndarray.flatten(scipy.ndimage.imread("im_01.jpg", flatten=True))) 

にありました。

+0

ありがとうございました。 –

+0

使用した画像の寸法を教えてください。 – Pre

+1

@Preここで私がテストした画像の一つです(https://github.com/cloutier/tf/blob/master/im_01.jpg) –

関連する問題