2017-08-16 7 views
0

私は約100以上の特徴を持つデータセットを持っています。私も共変量の小さなセットを持っています。統計モデルを使って回帰係数のt検定を評価する

各共変量に対してy = x + C1 + C2 + C3 + C4 + ... + Cnの統計モデルを使用してOLS線形モデルを構築し、特徴xと従属変数yを作成します。

私は係数が0に等しいかどうかをテストするために回帰係数について仮説検定を実行しようとしています。私はt検定がこれに対する適切なアプローチになると考えていましたが、これをPythonで実装する方法については、statsmodelsを使用してください。

私はhttp://www.statsmodels.org/devel/generated/statsmodels.regression.linear_model.RegressionResults.t_test.html#statsmodels.regression.linear_model.RegressionResults.t_test

を使いたいだろうと、特に、知っているしかし、私はr_matrixパラメータを理解し、特定していません。私はこれに何を与えることができますか?私は例を見ましたが、それは私には不明です。

さらに、私は共変量そのものについてt検定を行うことに興味はないが、xの回帰co-effだけを興味がある。

答えて

1

statsmodels.regression.linear_model.OLSは本当に不要ですか?これは、OLS回帰を実行し、パラメータ推定値および対応するp値(および他の多くのもの)を利用可能にする。

from statsmodels.regression import linear_model 
from statsmodels.api import add_constant 

Y = [1,2,3,5,6,7,9] 
X = add_constant(range(len(Y))) 

model = linear_model.OLS(Y, X) 
results = model.fit() 
print(results.params) # [ 0.75  1.32142857] 
print(results.pvalues) # [ 2.00489220e-02 4.16826428e-06] 

これらのp値はRegressionResults.t_testが少なく、従来の仮説のために有用であろうようです各フィットパラメーターのt検定は0

に等しいからです。

+0

t検定の結果は、私が行った場合と同じであってはなりませんか? – TimelordViktorious

+0

@TimelordViktoriousはい、そうです –

+0

もちろん、仮説が同じであると仮定すると、私は想像します。 – TimelordViktorious

関連する問題