2017-09-29 1 views
0

ロジスティック回帰分析を実行して、has_sed(バイナリ、サンプルに沈降物があるかどうかを示し、0 =は沈降物がなく、1 =沈降物)。以下、このモデルの要約出力を参照してください:ロジスティックモデルの解釈方向を決定するR

Call: 
glm(formula = has_sed ~ vw + ws_avg + s, family = binomial(link = "logit"), 
data = spdata_ss) 

Deviance Residuals: 
Min  1Q Median  3Q  Max 
-1.4665 -0.8659 -0.6325 1.1374 2.3407 

Coefficients: 
      Estimate Std. Error z value Pr(>|z|)  
(Intercept) 0.851966 0.667291 1.277 0.201689  
vw   -0.118140 0.031092 -3.800 0.000145 *** 
ws_avg  -0.015815 0.008276 -1.911 0.055994 . 
s   0.034471 0.019216 1.794 0.072827 . 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

(Dispersion parameter for binomial family taken to be 1) 

    Null deviance: 296.33 on 241 degrees of freedom 
Residual deviance: 269.91 on 238 degrees of freedom 
AIC: 277.91 

Number of Fisher Scoring iterations: 4 

は今、私は一般的にこのようなロジスティックモデルの出力を解釈する方法を理解し、私はRが方向を選択する方法を理解していない(のためのより良い言葉かもしれ私の従属変数のそれ)。ユニットの増加が堆積物を有するサンプルのログオッズを増加させるか、または堆積物を有さないサンプルのログオッズを増加させるか(すなわち、has_sed = 0対has_sed = 1)を知る方法は?

これらの関係のそれぞれをボックスプロットでプロットし、ロジスティックモデル出力の見積もりの​​サインは、ボックスプロットに表示されているものとは逆に見えます。だから、Rはhas_sedのログオッズを0と計算するのでしょうか、それともlog oddsは1ですか?

答えて

0

これは、例を用いて最もよく説明される、 私は2つのクラス

data(iris) 
iris2 = iris[iris$Species!="setosa",] 
iris2$Species = factor(iris2$Species) 
levels(iris2$Species) 
#output[1] "versicolor" "virginica" 

とアイリスデータを使用するには、GLM "virginicaの" という

model = glm(Species ~ Petal.Length, data = iris2, family = binomial(link = "logit")) 
summary(model) 
#truncated output 
    Coefficients: 
      Estimate Std. Error z value Pr(>|z|)  
(Intercept) -43.781  11.110 -3.941 8.12e-05 *** 
Petal.Length 9.002  2.283 3.943 8.04e-05 *** 


library(ggplot2) 

    ggplot(iris2)+ 
    geom_boxplot(aes(x = Species, y = Petal.Length)) 

enter image description here

チャンスを作ることができますPetal.Lengthが増加するにつれて上昇し、参照レベルは "versicolor"でした - 最初のレベルはlevels(iris2$Species)でした。

iris2$Species = relevel(iris2$Species, ref = "virginica") 
levels(iris2$Species) 
#output 
[1] "virginica" "versicolor" 

model2 = glm(Species ~ Petal.Length, data = iris2, family = binomial(link = "logit")) 
summary(model2) 
#truncated output 
Coefficients: 
      Estimate Std. Error z value Pr(>|z|)  
(Intercept) 43.781  11.110 3.941 8.12e-05 *** 
Petal.Length -9.002  2.283 -3.943 8.04e-05 *** 

次に基準レベルが "virginicaの" levels(iris2$Species)における最初のレベルであり、それを変更できます。 Petal.Lengthを増やしていくと、 "versicolor"が落ちる可能性があります。

要するに、応答変数のレベルの順序は、治療対比の参照レベルを決定します。

関連する問題