2017-08-21 13 views
0

SciKitLearnで決定木を作成しようとしています。 入力にNaN、無限大またはdtype( 'float64')には大きすぎる値が含まれています。SciKitLearnツリーがエラーを返す

.isnull()。入力データのany()を実行すると、すべての列でFalseが返されます。

float64型の4つの入力列があります。それらのデータは小数点以下2桁まで正しくフォーマットされていますが、狂った値はありません。

問題の原因は何か、どうすれば解決できますか?

y = df["CutoffValue"] 
X = df_new 
clf = tree.DecisionTreeClassifier() 
clf = clf.fit(X,y) 
+0

'df_new'とdf自体の構造/スナップショットを表示できますか? –

答えて

0

修正済み!この場合、エラーの「入力」はラベル付けされたデータを参照し、y!列のヌルを削除しました。すべて正常です。