2017-12-10 19 views
0

テンソルフローが新しくなった。モデルをトレーニングするためにデータセットをロードする必要があります。私は、スクリプトをコンパイルするときに、私のデータセットのサンプル私はtensorflowのドキュメントに記載されたコードを使用して、このcsvファイルをロードしテンソルフロー:csvデータファイルをロードしてモデルを訓練する

TRAINING_FILE.iloc[0:5,0:5] 

    num_var_1 num_var_2 num_var_3 num_var_4 num_var_5 
0 -0.010655 0.040182 0.0  1.800000e-07 -0.011319 
1 -0.006542 0.157872 0.0  2.105000e-06 -0.010966 
2 -0.010626 0.089140 0.0  3.550000e-07 -0.011286 
3 -0.010626 0.227239 0.0  1.050000e-06 -0.011159 
4 -0.008947 0.160410 0.0  2.105000e-06 -0.010966 

のように見えます.This私は私のトレーニングファイルをロードする方法である

train_fn = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename = TRAINING_FILE, 
    target_dtype = np.int, 
    features_dtype= np.float32) 

と私が得ましたエラー次

Traceback (most recent call last): File "train.py", line 31, in features_dtype = np.float32) File "/usr/local/lib/python2.7/dist-packages/tensorflow/contrib/learn/python/learn/datasets/base.py", line 48, in load_csv_with_header n_samples = int(header[0]) ValueError: invalid literal for int() with base 10: '-0.0106550312'

答えて

1

これらのすべては、山車のように見えるが、load_csv_with_header DTYPE target_dtype(あなたのケースでは整数)とラベル列を探しています。 target_column引数でこの列を選択できますが、デフォルトでは最後の列です。

実際の値を予測する場合は、ラベルdtypeをfloatに変更するか、データにラベル列を追加する必要があります。

関連する問題