2016-12-16 15 views
0

アイリスcsvでトレーニングして、自分のcsvを使用しようとしたプレハブコードを取得しました。テンソルに.csvをロードする際にエラーが発生しました。

エラーはCSVが、私はエラーが特長1であることを言おうとしていることを得るこの

feature1,feature2,feature3,label 
1028.0,1012.0,1014.0,1 
1029.0,1011.0,1017.0,-1 
1027.0,1013.0,1015.0,1 
...(and so on) 

のように見えるここでエラー

ValueError: invalid literal for int() with base 10: 'feature1' 

train_data = "train_data.csv" 
test_data = "test_data.csv" 

training_set = tf.contrib.learn.datasets.base.load_csv_with_header(
filename=train_data, 
target_dtype=np.int, 
features_dtype=np.float32) 

を発生しています整数ではありません。ただし、アイリスデータセットに同じコードを使用すると、テンソルとして使用されない文字列ヘッダーがあります。アイリスのデータcsvは次のようになります。

30,4,setosa,versicolor,virginica 
5.9,3.0,4.2,1.5,1 
6.9,3.1,5.4,2.1,2 
5.1,3.3,1.7,0.5,0 

はまた、わからない私は、この別の質問にする必要がある場合、私は

1,2,3,4 
1028.0,1012.0,1014.0,1 
1029.0,1011.0,1017.0,-1 
1027.0,1013.0,1015.0,1 
...(and so on) 

に機能ヘッダを変更し、今、このエラーに

ValueError: could not broadcast input array from shape (3) into shape (2) 

任意のアイデアを取得していますか助けていただければ幸いです!ありがとう!!!

答えて

2

この関数を使用する場合は、期待される形式でデータセットを書き込む必要があります。最初の行は次のようにすべきである:あなたが持っている場合は30のサンプル4つの特徴

すなわち

30,4,setosa,versicolor,virginica 

たとえば

n_samples, n_features, [feature names] 

、虹彩のための1つを使用して、表示されているデータセットの正しいフォーマットを有します作成したデータセットのサンプル数は、次のようになります。

50,4,labelname 
1028.0,1012.0,1014.0,1 
1029.0,1011.0,1017.0,-1 
1027.0,1013.0,1015.0,1 
...(and so on) 
+0

大変感謝しています。 –

+0

私の神私は、そのエラーの説明のためにどこからでも見てきました "形xからxまで入力配列をブロードキャストできませんでした"そしてこれはそれでした!私はヘッダーなしで私自身のCSVファイルを使用しようとしていた –

+0

ありがとうbtw!これは本当に私に頭痛を与えていた! –

関連する問題