0

私はコリスト内のすべてのX(入力変数)を持つ列車データフレーム(b)の回帰式を構築しました。私の応答変数 - YはSalePriceです。テストデータをPythonの回帰式に渡すにはどうすればよいですか?

X = b[collist].values 
y = b[['SalePrice']] 
reg2 = LinearRegression() 
reg2.fit(X, y) 
(reg2.intercept_, reg2.coef_) 

私は係数の配列を得ました。

(array([-1003980.93890187]), 
array([[ 1.13921901e+01, 6.72094755e-01, 3.57706059e+02, 
      9.11889135e+01, 1.74211742e+01, 1.49978955e+01, 
      1.01590205e+01, -2.39999419e+00, 2.27570861e+01, 
      .......... 
      ..more terms... 
      1.88596429e+01, 3.57099213e+01, -2.91352714e+01, 
      2.54343753e+01, 1.79479162e+03, 6.95632849e+02, 
      3.97891154e+03, 1.67768978e+03, -2.06711712e+03, 
      -4.70429021e+03]])) 

どのような係数をどのように指定するのですか?

また、この式でテストデータフレームを渡して応答変数を取得するにはどうすればよいですか?

テストデータの場合、SalePrice(応答)の列が存在しない別のデータフレームもあります。

ありがとうございます。

答えて

0

あなたは係数の列名をzipすることができるはず...限りテストフレーム上の予測として、それはあなたができる

reg2.predict(test_df)

のようなものでなければなりません

[name, coef for name, coef in zip(b.columns, reg2._coef) 

また、サンプル外Rの二乗に対するコールスコア

reg2.score(test_X, test_y) 

documentationを参照してください。

関連する問題