私はRを使ってデータに一般線形モデル(GLM)をフィットさせようとしています。私はY連続変数と2つのカテゴリファクタAとBを持っています。各ファクタは、存在または不在のため0または1としてコード化されています。glm()関数の使い方は?
データを見ても、AとBの間の明確な相互作用が見られたとしても、GLMはp-値>>> 0.05を示しています。私は何か間違っているのですか?
まず、Y依存変数と2つの要因AとBからなるGLMのデータを含むデータフレームを作成します。これらは2つのレベル係数(0と1)です。組み合わせごとに3つの複製があります。
A<-c(0,0,0,1,1,1,0,0,0,1,1,1)
B<-c(0,0,0,0,0,0,1,1,1,1,1,1)
Y<-c(0.90,0.87,0.93,0.85,0.98,0.96,0.56,0.58,0.59,0.02,0.03,0.04)
my_data<-data.frame(A,B,Y)
のは、それがどのようなものか見てみましょう:私たちは、Yの値が大幅に減少すると、単にデータを見て、因子Aと係数Bとの間に明確な相互作用があり、見ることができるように
my_data
## A B Y
## 1 0 0 0.90
## 2 0 0 0.87
## 3 0 0 0.93
## 4 1 0 0.85
## 5 1 0 0.98
## 6 1 0 0.96
## 7 0 1 0.56
## 8 0 1 0.58
## 9 0 1 0.59
## 10 1 1 0.02
## 11 1 1 0.03
## 12 1 1 0.04
AとBが存在するとき(すなわちA = 1とB = 1のとき)。しかし、>>> p値として、IはAとBの間に有意な相互作用を得るないGLM関数を使用して0.05
attach(my_data)
## The following objects are masked _by_ .GlobalEnv:
##
## A, B, Y
my_glm<-glm(Y~A+B+A*B,data=my_data,family=binomial)
## Warning: non-integer #successes in a binomial glm!
summary(my_glm)
##
## Call:
## glm(formula = Y ~ A + B + A * B, family = binomial, data = my_data)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -0.275191 -0.040838 0.003374 0.068165 0.229196
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 2.1972 1.9245 1.142 0.254
## A 0.3895 2.9705 0.131 0.896
## B -1.8881 2.2515 -0.839 0.402
## A:B -4.1747 4.6523 -0.897 0.370
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 7.86365 on 11 degrees of freedom
## Residual deviance: 0.17364 on 8 degrees of freedom
## AIC: 12.553
##
## Number of Fisher Scoring iterations: 6
ここには「添付」は不要で、良い考えではありません。 –
Konradありがとう、添付しないでスクリプトを実行しましたが、私は同じ結果を得ました(それはAとBの間の相互作用ではありません)なぜ私はこれを得ると思いますか?この相互作用は、SPSSやMinitabのような他の統計ソフトウェアではっきりしています。 –
私は正直なところ、あなたの「家族」はデータを適切にモデル化していないと思います。これを省略すると、重要な相関が得られます。 –