2017-03-17 16 views
1

値を予測しようとしています。私は実際の目標値を使用している時を予測することができます。それは数日ですが、値のログを使用して予測しようとすると、エラーが発生します。私はsklearnとランダムなフォレストを使用しています。ランダムフォレストのログを使用したときのエラーPython

コード:

X = final_pressure_df.drop(['y', 'log_y', 'patient_id', 'wound_id'], axis=1) 
Y = final_pressure_df['log_y'] 

X_train, X_test, Y_train, Y_test = sklearn.cross_validation.train_test_split(X, Y, test_size=0.4, random_state=5) 

forest = RandomForestClassifier(criterion='entropy', n_estimators=200, max_depth=100, random_state=5) 

forest.fit(X_train, Y_train) 

エラー:ValueError: Unknown label type: array([[ 3.91202301]

は、誰かが私を助けてくださいことはできますか?

答えて

0

分類ではなく回帰が必要なので、RandomForestRegressorを使用してください。 予測される変数が実数(float)の場合、分類は機能しません。また、最初のケースでも、日数を予測する場合でも、クラス/カテゴリではない値や日数を予測しているため、回帰を使用する方が理にかなっています。

+0

ありがとう、私はそれを試してみました! – bim1

関連する問題