2011-12-27 8 views
3

以下のコードは意図した通りに動作しますが、私の必要とするものではありません。私はc[1]c[1:]に変更したいので、ただ1つではなくすべてのx変数に対して回帰するようにしたい。私がその変更を行い(適切なxラベルを追加すると)、私は次のエラーを受け取ります:ValueError: matrices are not aligned。誰かがこれがなぜ起こっているのか説明し、コードの変更を提案できますか?ありがとう。Python、Numpy、OLS

from numpy import * 
from ols import * 

a = [[.001,.05,-.003,.014,.035,-.01,.032,-.0013,.0224,.005],[-.011,.012,.0013,.014,-.0015,.019,-.032,.013,-.04,-.05608], 
[.0021,.02,-.023,.0024,.025,-.081,.032,-.0513,.00014,-.00015],[.001,.02,-.003,.014,.035,-.001,.032,-.003,.0224,-.005], 
[.0021,-.002,-.023,.0024,.025,.01,.032,-.0513,.00014,-.00015],[-.0311,.012,.0013,.014,-.0015,.019,-.032,.013,-.014,-.008], 
[.001,.02,-.0203,.014,.035,-.001,.00032,-.0013,.0224,.05],[.0021,-.022,-.0213,.0024,.025,.081,.032,.05313,.00014,-.00015], 
[-.01331,.012,.0013,.014,.01015,.019,-.032,.013,-.014,-.012208],[.01021,-.022,-.023,.0024,.025,.081,.032,.0513,.00014,-.020015]] 


c = column_stack(a) 
y = c[0] 
m = ols(y, c[1], y_varnm='y', x_varnm=['x1']) 
print m.summary() 

編集:私は部分的な解決策を考え出しましたが、まだ問題があります。以下のコードは、9つの説明変数のうちの8つで機能します。私は第九x変数を含めるしようとすると

c = column_stack(a) 
y = c[0] 
x = column_stack([c[i] for i in range(1, 9)]) 
m = ols(y, x, y_varnm='y', x_varnm=['x1','x2','x3','x4','x5','x6','x7','x8']) 
print m.summary() 

はしかし、私は次のエラーを取得する:RuntimeWarning: divide by zero encountered in double_scalars。どんな考え?ここでは、コード(len(a) = 10ということに注意してください)です。

c = column_stack(a) 
y = c[0] 
x = column_stack([c[i] for i in range(1, len(a))]) 
m = ols(y, x, y_varnm='y', x_varnm=['x1','x2','x3','x4','x5','x6','x7','x8','x9']) 
print m.summary() 
+0

'ols'は何ですか?私にとって、それは「普通の正方形」を意味しますが、あなたは別の図書館を使用しないでしょうか? –

+0

OLSはNumpyと連携するクラスです。多変量回帰モデルを推定し、適合統計を提供します。 – johnjdc

+0

OLS:http://www.scipy.org/Cookbook/OLS – askewchan

答えて

3

私はあなたが使用しているOLSモジュールについては何も知りません。しかし、あなたはS cikits.statsmodelsで次のことをしようとした場合、それが動作するはずです:

import numpy as np 
import scikits.statsmodels.api as sm 

a = np.array([[.001,.05,-.003,.014,.035,-.01,.032,-.0013,.0224,.005],[-.011,.012,.0013,.014,-.0015,.019,-.032,.013,-.04,-.05608], 
[.0021,.02,-.023,.0024,.025,-.081,.032,-.0513,.00014,-.00015],[.001,.02,-.003,.014,.035,-.001,.032,-.003,.0224,-.005], 
[.0021,-.002,-.023,.0024,.025,.01,.032,-.0513,.00014,-.00015],[-.0311,.012,.0013,.014,-.0015,.019,-.032,.013,-.014,-.008], 
[.001,.02,-.0203,.014,.035,-.001,.00032,-.0013,.0224,.05],[.0021,-.022,-.0213,.0024,.025,.081,.032,.05313,.00014,-.00015], 
[-.01331,.012,.0013,.014,.01015,.019,-.032,.013,-.014,-.012208],[.01021,-.022,-.023,.0024,.025,.081,.032,.0513,.00014,-.020015]]) 

y = a[:, 0] 
x = a[:, 1:] 
results = sm.OLS(y, x).fit() 
print results.summary() 

出力:

 Summary of Regression Results 
======================================= 
| Dependent Variable:   ['y']| 
| Model:       OLS| 
| Method:    Least Squares| 
| # obs:       10.0| 
| Df residuals:     1.0| 
| Df model:      8.0| 
============================================================================== 
|     coefficient  std. error t-statistic   prob. | 
------------------------------------------------------------------------------ 
| x0      0.2557   0.6622   0.3862   0.7654 | 
| x1     0.03054   1.453   0.0210   0.9866 | 
| x2      -3.392   2.444  -1.3877   0.3975 | 
| x3      1.445   1.474   0.9808   0.5062 | 
| x4     0.03559   0.2610   0.1363   0.9137 | 
| x5     -0.7412   0.8754  -0.8467   0.5527 | 
| x6     0.02289   0.2466   0.0928   0.9411 | 
| x7      0.5754   1.413   0.4074   0.7537 | 
| x8     -0.4827   0.7569  -0.6378   0.6386 | 
============================================================================== 
|       Models stats      Residual stats | 
------------------------------------------------------------------------------ 
| R-squared:      0.8832 Durbin-Watson:    2.578 | 
| Adjusted R-squared:   -0.05163 Omnibus:     0.5325 | 
| F-statistic:     0.9448 Prob(Omnibus):    0.7663 | 
| Prob (F-statistic):   0.6663 JB:      0.1630 | 
| Log likelihood:     41.45 Prob(JB):     0.9217 | 
| AIC criterion:     -64.91 Skew:      0.4037 | 
| BIC criterion:     -62.18 Kurtosis:     2.405 | 
------------------------------------------------------------------------------ 
+0

これは機能します。ありがとう。クイックノート:私の例では、y =各サブリストの最初の数字を設定し、x1は各サブリストの2番目の数字です。y =全体の最初のサブリストになるように設定したと思います。 – johnjdc

+0

あなたの例では、私はこのコードを使って最初のx変数に対して回帰しようとすると回帰が失敗するのはなぜですか? "results = sm.OLS(y、x [0])。fit()"? – johnjdc

+0

ああ、それを指摘してくれてありがとう。私はちょうど私が修正した更新プログラムと思います。 – ars