11
私はleveragePlot()を使ってプロットを生成する方法を知っていますが、megastat出力のように各観測のためのレバレッジの統計を生成する方法を見つけることはできません。レバレッジの統計情報を作成する方法は?
私はleveragePlot()を使ってプロットを生成する方法を知っていますが、megastat出力のように各観測のためのレバレッジの統計を生成する方法を見つけることはできません。レバレッジの統計情報を作成する方法は?
あなたはハット値を探していると思います。
hatvalues(fit)
を使用してください。経験則は、平均ハット値よりも2〜3倍の観察値を調べることです。私は素晴らしい情報フレームでこの情報を提供する私の頭の上から特定の機能やパッケージを知りませんが、それを自分で行うことはかなり簡単です。ここでは例です:大規模データ用
fit <- lm(hp ~ cyl + mpg, data=mtcars) #a fake model
hatvalues(fit)
hv <- as.data.frame(hatvalues(fit))
mn <-mean(hatvalues(fit))
hv$warn <- ifelse(hv[, 'hatvalues(fit)']>3*mn, 'x3',
ifelse(hv[, 'hatvalues(fit)']>2*mn, 'x3', '-'))
hv
は、あなただけの特定の値を見てsubset
および/またはorder
を使用することができます設定ハットの値の範囲:私は実際には素敵なプロット機能に出くわした
subset(hv, warn=="x3")
subset(hv, warn%in%c("x2", "x3"))
hv[order(hv['hatvalues(fit)']), ]
これは書籍R in Actionでこれを行いますが、これは著作権のある本であるため、私はKabacoffの知的財産を表示しません。しかし、このプロットは、中規模のデータセットではさらに効果的です。あなたも調査したいかもしれないけれどもここ
はまともな帽子のプロットである:plot(hatvalues(fit), type = "h")