Tensorflow Irisデータセットが収束しない

Irisデータセットで標準NNを実行しようとしています。ラベルは種に応じて0,1,2の値を持つことができる単一の列です。私はx軸にフィーチャを、yのサンプルを転置します。Tensorflow Irisデータセットが収束しない

関心領域：コスト関数 - 誰もがあらかじめ作成されたものを使用しているようですが、私のデータはワンホットエンコードではないので標準損失を使用しています。オプティマイザ - 私はそれをブラックボックスとして使用しており、コストを適切に更新するかどうかはわかりません。

ご協力いただきありがとうございます。

import tensorflow as tf 
import numpy as np 
import pandas as pd 

import tensorflow as tf 


def create_layer(previous_layer, weight, bias, activation_function=None): 
    z = tf.add(tf.matmul(weight, previous_layer), bias) 
    if activation_function is None: 
     return z 
    a = activation_function(z) 
    return a 


def cost_compute(prediction, correct_values): 
    return tf.nn.softmax_cross_entropy_with_logits(logits = prediction, labels = correct_values) 

input_features = 4 
n_hidden_units1 = 10 
n_hidden_units2 = 14 
n_hidden_units3 = 12 
n_hidden_units4 = 1 

rate = .000001 

weights = dict(
      w1=tf.Variable(tf.random_normal([n_hidden_units1, input_features])), 
      w2=tf.Variable(tf.random_normal([n_hidden_units2, n_hidden_units1])), 
      w3=tf.Variable(tf.random_normal([n_hidden_units3, n_hidden_units2])), 
      w4=tf.Variable(tf.random_normal([n_hidden_units4, n_hidden_units3])) 
      ) 

biases = dict(
      b1=tf.Variable(tf.zeros([n_hidden_units1, 1])), 
      b2=tf.Variable(tf.zeros([n_hidden_units2, 1])), 
      b3=tf.Variable(tf.zeros([n_hidden_units3, 1])), 
      b4=tf.Variable(tf.zeros([n_hidden_units4, 1])) 
      ) 

train = pd.read_csv("/Users/yazen/Desktop/datasets/iris_training.csv") 
test = pd.read_csv("/Users/yazen/Desktop/datasets/iris_test.csv") 

train.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'species'] 
test.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'species'] 

train_labels = np.expand_dims(train['species'].as_matrix(), 1) 
test_labels = np.expand_dims(test['species'].as_matrix(), 1) 

train_features = train.drop('species', axis=1) 
test_features = test.drop('species', axis=1) 

test_labels = test_labels.transpose() 
train_labels = train_labels.transpose() 
test_features = test_features.transpose() 
train_features = train_features.transpose() 

x = tf.placeholder("float32", [4, None], name="asdfadsf") 
y = tf.placeholder("float32", [1, None], name="asdfasdf2") 

layer = create_layer(x, weights['w1'], biases['b1'], tf.nn.relu) 
layer = create_layer(layer, weights['w2'], biases['b2'], tf.nn.relu) 
layer = create_layer(layer, weights['w3'], biases['b3'], tf.nn.relu) 
Z4 = create_layer(layer, weights['w4'], biases['b4']) 
cost = cost_compute(Z4, y) 

with tf.Session() as sess: 
    sess.run(tf.global_variables_initializer()) 
    for iteration in range(1,50): 
     optimizer = tf.train.GradientDescentOptimizer(learning_rate=rate).minimize(cost) 
     _, c = sess.run([optimizer, cost], feed_dict={x: train_features, y: train_labels}) 
     print("Iteration " + str(iteration) + " cost: " + str(c)) 

    prediction = tf.equal(Z4, y) 
    accuracy = tf.reduce_mean(tf.cast(prediction, "float")) 
    print(sess.run(Z4, feed_dict={x: train_features, y: train_labels})) 
    print(accuracy.eval({x: train_features, y: train_labels}))

出典

2017-09-03 user3204416

高い学習率を試しましたか？ –

@JakubBartczukこんにちはJakubはとても感謝しています。学習率が高いほど私は収束しましたが、私の価値はすべて間違っているようです。私は何が間違っているのか分かりません（0％の精度）。私はこのモデルをどのように改善できるかについて何か提案がありますか？ – user3204416

分類に問題があるため、ラベルをワンホットフォームに変換する必要があります。この目的でtf.one_hotを使用できます。また、下記の例のように（hereから）、tf.reduce_meanを適用することもできます。さらに、あなたの学習率は私にとっては小さすぎるようです。

mnist = input_data.read_data_sets(FLAGS.data_dir, one_hot=True) 

    x = tf.placeholder(tf.float32, [None, 784]) 
    W = tf.Variable(tf.zeros([784, 10])) 
    b = tf.Variable(tf.zeros([10])) 
    y = tf.matmul(x, W) + b 

    # Define loss and optimizer 
    y_ = tf.placeholder(tf.float32, [None, 10]) 

    cross_entropy = tf.reduce_mean(
     tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y)) 
    train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy) 

    sess = tf.InteractiveSession() 
    tf.global_variables_initializer().run() 
    # Train 
    for _ in range(1000): 
    batch_xs, batch_ys = mnist.train.next_batch(100) 
    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys}) 

    # Test trained model 
    correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1)) 
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) 
    print(sess.run(accuracy, feed_dict={x: mnist.test.images, 
             y_: mnist.test.labels}))

出典

2017-09-04 08:19:10

ちょっと！、確かに精度が低いargmaxでした。本当にありがとう。 – user3204416

Tensorflow Irisデータセットが収束しない

答えて

関連する問題