2017-05-17 5 views
1

glmerのランダムエフェクトモデルをlme4からRに設定しています。条件付き平均値(条件付きモード)またはランダム効果のプロットがこのように見えるのはなぜですか?

enter image description here

私の理解では、ランダム効果は平均0、分散1.632(上記参照)の正規分布から来るということです。だから私は、条件付き平均の分布(または条件付きモード、getME(modelfit, 'b')を使用して得られる)がベルカーブを多かれ少なかれ従うべきであると予想していました。私は条件付き手段のヒストグラムをプロットするとき は、しかし、私はそれは非常にそれが0のプロットで区切られた2つの独立したディストリビューションのように見えますstrangelたことはここにある:

enter image description here

条件付きモードの対応QQプロット: enter image description here

誰でもこの意味を知っていますか?いくつかの強力な交配者はありますか?それとも、このように振る舞うことができますか?

+1

パスワードの後ろではありません画像のどこかを投稿してください。私はそれを編集します。私があなたの質問と手元の問題を正しく理解していれば、ランダムな効果は正規分布から来ると想定されます。もちろん、個々の推定値がその分布から来ることを意味するわけではありません。それはあなたのデータに依存します。 –

+0

私はあなたがプロットを見ることができないことを大変申し訳ありません。ここに別のリンクがあります:https://github.com/rikku1983/Mixed-model/blob/master/Screen%20Shot%202017-05-17%20at%208.42.31 %20 AM.pngとフィット感の概要はここにある:https://github.com/rikku1983/Mixed-model/blob/master/Screen%20Shot%202017-05-17%20at%209.13.22%20AM.pngあなたがコピーしてあなたの答え –

+0

は、 –

答えて

2

@RomanLustrikは、基礎となるの仮定をの条件付きモードの正規化と条件付きモードの推定値との間で区別するのが正しいです。推定値はノーマルである必要はありません。条件付きモードの分布の診断プロットについては、?qqmath.ranef.merを参照してください。あなたの条件付きモードの分布がNormalから大きく離れている場合は、本当に問題があるかもしれません。残念ながら、正規性の仮定を緩和することは、モデリングをいくらか困難にする。たとえば、条件付きモードが2つの法線を混在させていると仮定した潜在混合モデルを使うことができるかもしれませんが、これを実装するRパッケージについてはわかりません。もし私がそれをやろうとすれば、JAGSやStanのようなツールボックスを使って実装するでしょう。

あなたがその方向に行く前に、データの特性(グループあたり約2回のベルヌーイ観測)は、デフォルトのラプラス近似が非常にであると予想されるように注意することが重要です。試してくださいnAGQ=10(またはそれ以上);あなたのフィッティングをかなり遅くしますが、結果を改善する可能性があります。

+0

がご説明いただき、誠にありがとうございますありがとうございました。私はそれのように見える条件付きモードのqqplotをプロットしようとしました。 https://github.com/rikku1983/Mixed-model/blob/master/Screen%20Shot%202017-05-18%20at%209.28.13%20AM.png –

+0

そして、私はまだ見積もりが来る必要がない場合は、その混乱しています正規分布から、qqplotをプロットする理由は何ですか?私はまだqqplotがヒストグラムと同じことを話していると思います。さらに、条件付きモードは被験者レベルの残差のようなものだと考えることができますか?それで、私たちは通常の線形モデルで残差にするようにそれらを診断できますか? –

+0

はい、あなたは正しいです、条件付きモードは、対象レベルでの残差に類似しているので、様々な診断(不均一、正規、など)はすべて関連しています。 Q-Qプロットは確かにヒストグラムと同じ情報を表示しますが、ノーマリティと微妙な違いを見るのは簡単です(微妙な違いではありません)。 –

0

ありがとうございます@BenBolkerあなたの助けになりました。私は最終的に私の試練と経験に基づいて結論を書いています。ちょうどちょっと要約したい答えがありません。 1.条件付き平均は、ランダム効果の通常のランダム変数の予測値です。特定のデータからのすべての条件付き平均のヒストグラムとQQplotは、基本的には何でもかまいませんが、実際にはほとんどの現実的なケースでは、ベルカーブに従いません。これはあなたのデータに完全に依存します。上記の例のように、2つのモードのヒストグラムを確認しました。これは、修正効果が実際に予測するのに多大な影響を与えないため、ランダムなエフェクトを2つのモードにドラッグすることで、これを理解するには、https://github.com/rikku1983/Mixed-model/blob/master/diagnostic1.pngを参照してください。このプロットでは、x軸は固定効果のみからのリンクレベルの値、ランダム効果(条件付きモード、ランダム効果が1つしかないため)と両方の値です。プロット内の数字は予測力です。 2.これは、自然な疑問につながります。条件付きモードの分布は、仮定を満たすためにベルカーブに従う必要がありますか?私はこれがあなたのデータに起因するとは言いません。言い換えれば、あなたのデータが人口の良好な表現ではない場合でも、モデルは真実に近く、条件付きモードは、人口。 3.これは、一般化された混合モデルをどのように診断すべきか、ランダム成分間の正規性と独立性をテストするというより一般的な問題につながるか?私はGoogleで検索しましたが、まだ役に立たないと思ったものは見つけていません。どんな提案も大歓迎です。

ここでも、上記のすべての権利であることが保証されていません。それがそれにふさわしいのであれば、議論のために私の理解を持ち込んでください。

関連する問題