2016-09-05 10 views
1

私は現在、4つの変数とデータセットに対して多項式回帰を行い、次のコードを、持っている:scikit-learnで多項式回帰から回帰分析サマリーを出力するには?

def polyreg(): 
    dataset = genfromtxt(open('train.csv','r'), delimiter=',', dtype='f8')[1:] 
    target = [x[0] for x in dataset] 
    train = [x[1:] for x in dataset] 
    test = genfromtxt(open('test.csv','r'), delimiter=',', dtype='f8')[1:] 

    poly = PolynomialFeatures(degree=2) 
    train_poly = poly.fit_transform(train) 
    test_poly = poly.fit_transform(test) 

    clf = linear_model.LinearRegression() 
    clf.fit(train_poly, target) 

    savetxt('polyreg_test1.csv', clf.predict(test_poly), delimiter=',', fmt='%f') 

Iを出力する方法は、Excelのような回帰の要約があったかどうかを知りたいと思いましたの?私はlinear_model.LinearRegression()の属性/メソッドを調べましたが、何も見つかりませんでした。

enter image description here

答えて

3

これは、学ぶscikitに実装されていません。シキットを学ぶエコシステムは、モデル評価にクロスバリデーションを使用することにかなり偏っています(これは私の意見では良いことです;テスト統計の大部分はコンピュータがクロスバリデーションを実行するには十分強力です)。

import numpy as np 
import statsmodels.api as sm 

nsample = 100 
x = np.linspace(0, 10, 100) 
X = np.column_stack((x, x**2)) 
beta = np.array([1, 0.1, 10]) 
e = np.random.normal(size=nsample) 

X = sm.add_constant(X) 
y = np.dot(X, beta) + e 

model = sm.OLS(y, X) 
results = model.fit() 
print(results.summary()) 
          OLS Regression Results 
============================================================================== 
Dep. Variable:      y R-squared:      1.000 
Model:       OLS Adj. R-squared:     1.000 
Method:     Least Squares F-statistic:     4.020e+06 
Date:    Sun, 01 Feb 2015 Prob (F-statistic):   2.83e-239 
Time:      09:32:32 Log-Likelihood:    -146.51 
No. Observations:     100 AIC:        299.0 
Df Residuals:      97 BIC:        306.8 
Df Model:       2 
Covariance Type:   nonrobust 
============================================================================== 
       coef std err   t  P>|t|  [95.0% Conf. Int.] 
------------------------------------------------------------------------------ 
const   1.3423  0.313  4.292  0.000   0.722  1.963 
x1   -0.0402  0.145  -0.278  0.781  -0.327  0.247 
x2   10.0103  0.014 715.745  0.000   9.982 10.038 
============================================================================== 
Omnibus:      2.042 Durbin-Watson:     2.274 
Prob(Omnibus):     0.360 Jarque-Bera (JB):    1.875 
Skew:       0.234 Prob(JB):      0.392 
Kurtosis:      2.519 Cond. No.       144. 
============================================================================== 
:あなたは statsmodelsを使用することができ、統計解析のより伝統的なタイプの

は、ここでの例であるtaken from their documentation

関連する問題