2017-06-22 4 views
3

私は現在、APA-6の推奨にしたがって、rstanarm::stan_lmer()の出力を報告する方法に苦労しています。rstanarmを使用してAPAスタイルのベイジアンリニア(混合)モデルをレポートするにはどうすればよいですか?

最初に、私は頻繁なアプローチの中で混合モデルを適合させ、次にベイジアンフレームワークを使って同じことを試みます。

ここでデータを取得するための再現性のあるコードです:

library(tidyverse) 
library(neuropsychology) 
library(rstanarm) 
library(lmerTest) 

df <- neuropsychology::personality %>% 
    select(Study_Level, Sex, Negative_Affect) %>% 
    mutate(Study_Level=as.factor(Study_Level), 
     Negative_Affect=scale(Negative_Affect)) # I understood that scaling variables is important 

それでは、(負の影響を与える負にセックスの影響をテストするための「伝統的な」方法(女性/男性)で線形混合モデルに適合してみましょうムード)と学習レベル(教育年数)との関係をランダムな要素として扱う。

fit <- lmer(Negative_Affect ~ Sex + (1|Study_Level), df) 
summary(fit) 

出力は以下の通りです:

Linear mixed model fit by REML t-tests use Satterthwaite approximations to degrees of 
    freedom [lmerMod] 
Formula: Negative_Affect ~ Sex + (1 | Study_Level) 
    Data: df 

REML criterion at convergence: 3709 

Scaled residuals: 
    Min  1Q Median  3Q  Max 
-2.58199 -0.72973 0.02254 0.68668 2.92841 

Random effects: 
Groups  Name  Variance Std.Dev. 
Study_Level (Intercept) 0.04096 0.2024 
Residual    0.94555 0.9724 
Number of obs: 1327, groups: Study_Level, 8 

Fixed effects: 
       Estimate Std. Error   df t value Pr(>|t|)  
(Intercept) 0.01564 0.08908 4.70000 0.176 0.868  
SexM   -0.46667 0.06607 1321.20000 -7.064 2.62e-12 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Correlation of Fixed Effects: 
    (Intr) 
SexM -0.149 

それを報告するために、私たちは否定的で線形混合モデルは、結果変数として影響を与え取り付け、予測因子と研究レベルのようなセックスが入力された」と言うでしょう。ランダム効果として、このモデルの中で、男性のレベルは負の有意な減少につながった影響を与える(ベータ= -0.47、T(1321)= - 7.06、P < 0.001)

は正しい

です。?

それでは、rstanarmを使用してベイズフレームワーク内でモデルに適合してみましょう:

fitB <- stan_lmer(Negative_Affect ~ Sex + (1|Study_Level), 
        data=df, 
        prior=normal(location=0, scale=1), 
        prior_intercept=normal(location=0, scale=1), 
        prior_PD=F) 
print(fitB, digits=2) 

これが返されます。

stan_lmer 
family: gaussian [identity] 
formula: Negative_Affect ~ Sex + (1 | Study_Level) 
------ 

Estimates: 
      Median MAD_SD 
(Intercept) 0.02 0.10 
SexM  -0.47 0.07 
sigma  0.97 0.02 

Error terms: 
Groups  Name  Std.Dev. 
Study_Level (Intercept) 0.278 
Residual    0.973 
Num. levels: Study_Level 8 

Sample avg. posterior predictive 
distribution of y (X = xbar): 
     Median MAD_SD 
mean_PPD 0.00 0.04 

------ 
For info on the priors used see help('prior_summary.stanreg'). 

を私はmedianは、係数の事後分布の中央値であるとmad_sdよりも考えます標準偏差に相当する。これらのパラメータは、安心している頻繁に使用されるモデルのベータと標準誤差に近いものです。しかし、私はどのように形式化し、出力を言葉で表現するのか分かりません。私はモデル(summary(fitB, probs=c(.025, .975), digits=2))の要約をすれば

はまた、私は、事後分布の他の機能を得る:

... 
Estimates: 
              mean  sd  2.5%  97.5% 
(Intercept)         0.02  0.11 -0.19  0.23 
SexM           -0.47  0.07 -0.59 -0.34 
... 

は、次の良いようなものですか?

"ベイジアンフレームワーク内の線形混合モデルを結果変数としての性別を予測変数とし、研究レベルをランダム効果として入力しました。係数と切片の優先度は正常(平均= 0このモデルでは、男性のレベルに関連する係数の事後分布の特徴は、負の影響の減少を示唆する(平均= -0.47、sd = 0.11,95%CI [-0.59、-0.34]あなたの助けのため)。

ありがとうございました。次

答えて

6

は、あるいは心理学ジャーナルに許容可能であってもなくてもよい個人的な意見です。

これを報告するには、「結果変数、性別を予測変数として負の影響を持つ線形混合モデルを適合させ、研究レベルをランダム効果として入力しました。このモデルでは、男性のレベルは、負の影響(β= -0.47、t(1321)= - 7.06、p <.001)の有意な減少をもたらした。

これは間違いありませんか?

これは、頻繁な観点からは正しいと考えられます。

ベイズの観点から重要な概念は、真の効果は後方中央値未満、0.5確率は真であることを0.5可能性がある(もちろん、モデルを条件)

  1. ことです効果は後部中央値よりも大きい。頻繁に見られる傾向は、後部中央値が数値最適値のように見える傾向があります。
  2. posterior_interval関数は中央値の周りに信頼できる間隔をもたらします。デフォルト確率は0.9です(ただし、数値が小さいほど境界の推定値はより正確になります)。したがって、真の効果がそれらの境界の間にある確率は0.9であると正当に言うことができます。頻繁に見られる傾向は、信頼区間が信頼できる区間のように見える傾向があります。
  3. as.data.frame関数を使用すると、生の描画にアクセスできるようになるため、mean(as.data.frame(fitB)$male > 0)は、同じ研究の男女間の結果の期待される差がプラスになる確率をもたらします。頻繁に見られる傾向は、これらの確率がp値のように見える傾向があります。ベイジアンアプローチの

、私たちは、負とマルコフ連鎖モンテカルロ法を用いて線形モデルは、結果変数として影響し合う

、予測値と切片など男女が研究によって変化することが許されたと言うでしょうレベル。

そして、上の3つの概念を使って見積もりを話してください。

関連する問題