2012-02-28 12 views

答えて

20

あなたはハット値を探していると思います。

hatvalues(fit)を使用してください。経験則は、平均ハット値よりも2〜3倍の観察値を調べることです。私は素晴らしい情報フレームでこの情報を提供する私の頭の上から特定の機能やパッケージを知りませんが、それを自分で行うことはかなり簡単です。ここでは例です:大規模データ用

fit <- lm(hp ~ cyl + mpg, data=mtcars) #a fake model 

hatvalues(fit) 

hv <- as.data.frame(hatvalues(fit)) 
mn <-mean(hatvalues(fit)) 
hv$warn <- ifelse(hv[, 'hatvalues(fit)']>3*mn, 'x3', 
    ifelse(hv[, 'hatvalues(fit)']>2*mn, 'x3', '-')) 

hv 

は、あなただけの特定の値を見てsubsetおよび/またはorderを使用することができます設定ハットの値の範囲:私は実際には素敵なプロット機能に出くわした

subset(hv, warn=="x3") 
subset(hv, warn%in%c("x2", "x3")) 
hv[order(hv['hatvalues(fit)']), ] 

これは書籍R in Actionでこれを行いますが、これは著作権のある本であるため、私はKabacoffの知的財産を表示しません。しかし、このプロットは、中規模のデータセットではさらに効果的です。あなたも調査したいかもしれないけれどもここ

はまともな帽子のプロットである:

plot(hatvalues(fit), type = "h") 
関連する問題