2012-05-03 5 views
0

Rで重回帰を実行した後、回帰サマリは星に重要な変数を示します。私が取り組んでいるデータセットには2000近い変数があり、Rによって識別される重要な変数には50以上の変数が含まれています。回帰サマリーから重要変数のリストだけを得ることができる方法はありますか?Rでは、多数の変数を使用して重回帰を実行した後に重要変数のみを抽出する方法

+1

これは非科学的調査方法です。偶然だけに基づいて予想される結果よりも、「重要な」結果の割合が低くなります。それは、あなたが大きな脂肪 "ゼロ"を結果として得ることができることを意味します。乱数だけでデータ行列を設定してみると、あなたの記述に非常によく似たものが表示されます。 –

答えて

10

これはあなたが行うために私たちを頼む何をすべきではない理由の例です:

randf <- as.data.frame(matrix(rnorm(800*400), 800, 400)) 
names(randf)[1] <- "Y" 
big.mod <- lm(Y ~ ., data=randf) 
sum(summary(big.mod)$coefficients[ ,4] < 0.05) 
#[1] 22 

だから我々は22の有意係数(そのうちのいくつか「非常に重要」)は、単にに対して400個のランダムな変数を回帰取得もう一つの確率変数。

関連する問題