2017-08-16 4 views
0

私は700の異なるアカウントを持つデータセットを持っています。各口座にはxとyの変数を持つ複数の行があります。合計で約26000行のデータがあります。私は、特定の勘定科目に関連する「影響力のある」ポイントを見つけることを試みています。私はlmlist関数を使用して、推定係数をGLRに取得しました。件名内の料理の距離を探すR

model3 <- lmList(y ~ x | grp, data = dat)

私が影響し、その後CookD機能を使用しようとしましたが、私はそれがlmListとの互換性はありません信じています。

私は調理機能がlmerで動作しますが、私のデータセットと収束の失敗に関する警告をlmerスローことを知っている:

model1 <- lmer(y ~ x + (x | grp) , data = dat)

私はこの上で多くの記事を読んで、まだ混乱しています。私は達成しようとしていることを書くためにもう少し専門知識を持っていたらいいと思う。どんな助けでも大歓迎です。

+0

あなたにすべての私の答えは役に立ちましたか?あるいは、あなたの質問にもっと助けが必要ですか? – meenaparam

答えて

1

重要なことは、nlme::lmListlistオブジェクトを返します。そのため、リストメソッドを使用する必要があります。 irisデータ上に作られたモデルを使用して、これを行うには

二つの方法。最初の方法は各グループの別々のモデルを推定し、2番目の方法は複数レベルのモデルに適合し、グループ内にネストされた観察を行います。

library(nlme) 

# run the models and store them 
modlist <- lmList(object = Petal.Length ~ Sepal.Length | Species, data = iris) 

# see the results 
summary(modlist) 

これが返されます:base RからnlmeからlmListcooks.distanceを使用してまず

Call: 
    Model: Petal.Length ~ Sepal.Length | Species 
    Data: iris 

Coefficients: 
    (Intercept) 
      Estimate Std. Error t value Pr(>|t|) 
setosa  0.8030518 0.5310388 1.5122280 0.1326674 
versicolor 0.1851155 0.4305590 0.4299423 0.6678803 
virginica 0.6104680 0.3882233 1.5724662 0.1180371 
    Sepal.Length 
      Estimate Std. Error t value  Pr(>|t|) 
setosa  0.1316317 0.10582369 1.243877 2.155658e-01 
versicolor 0.6864698 0.07226626 9.499174 6.483105e-17 
virginica 0.7500808 0.05866167 12.786556 1.714921e-25 

Residual standard error: 0.2611123 on 144 degrees of freedom 

今クックの距離を取得:

cooks1 <- lapply(modlist, cooks.distance) 

第二に、lmListを使用してからlme4CookDpredictmeansから:

library(predictmeans) 
# this loads lme4 as a required package 

# run the models and store them 
modlist2 <- lmer(Petal.Length ~ Sepal.Length + (1 | Species), data = iris) 

# see the results 
summary(modlist2) 

これが返されます。

Linear mixed model fit by REML ['lmerMod'] 
Formula: Petal.Length ~ Sepal.Length + (1 | Species) 
    Data: iris 

REML criterion at convergence: 69.3 

Scaled residuals: 
    Min  1Q Median  3Q  Max 
-2.71305 -0.62672 0.02935 0.61922 2.83011 

Random effects: 
Groups Name  Variance Std.Dev. 
Species (Intercept) 2.52912 1.5903 
Residual    0.07984 0.2826 
Number of obs: 150, groups: Species, 3 

Fixed effects: 
      Estimate Std. Error t value 
(Intercept) 0.05252 0.95576 0.055 
Sepal.Length 0.63414 0.04525 14.014 

Correlation of Fixed Effects: 
      (Intr) 
Sepal.Lngth -0.277 

をクックの距離と関連するプロットを取得:

cooks2 <- CookD(model = modlist2) 

CookDもここに警告を収束するために何らかの障害をスローしますが、プロットは大丈夫と思われ、影響力のある点がはっきりと目立ちます。