2016-04-26 2 views
1

DecisionTreeRegressorを使用するモデルを開発しています。私は訓練データを使ってツリーを構築してフィットさせ、モデルの精度を確認するために最近のデータから結果を予測しました。ツリーを構築し、適合するようにDecisionTreeRegressorに元のデータへの予測出力を結合するには

: X = np.matrix(pre_x) Y = np.matrix(pre_y) regr_b = DecisionTreeRegressor(MAX_DEPTH = 4) regr_b.fit(X、Y)

新しいデータ予測する

:X = np.matrix (pre_test_x) trial_pred = regr_b.predict(X、check_input = TRUE)

trial_predは、予測値の配列です。私はそれをpre_test_xに戻す必要があるので、実際に起こったことと予測がどれほどうまく一致しているかを見ることができます。

私が試してみましたマージ:

all_pred = pre_pre_test_x.merge(predictions, left_index = True, right_index = True) 

all_pred = pd.merge (pre_pre_test_x, predictions, how='left', left_index=True, right_index=True ) 

とどちらかは結果や既存のすべての列にNaNにしてデータフレームの一番下に追加の列の2番目のコピーを取得していません。

答えて

1

それは簡単だった。予測出力を配列としてそのまま残しておきます。 w_pred = pre_pre_test_x.copy(深度= True) w_pred ['pred_val'] = trial_pred

関連する問題