data(iris)
Binary dependent variable:
iris$Species_binary <- ifelse(iris$Species=="setosa", "no", "yes")
これは要因として機能しますか?
glm(as.factor(iris$Species_binary)~iris$Sepal.Length, family="binomial")
はい、あります。
Call: glm(formula = as.factor(iris$Species_binary) ~ iris$Sepal.Length,
family = "binomial")
Coefficients:
(Intercept) iris$Sepal.Length
-27.829 5.176
Degrees of Freedom: 149 Total (i.e. Null); 148 Residual
Null Deviance: 191
Residual Deviance: 71.84 AIC: 75.84
それは論理(ブール)変数として動作しますか?
glm(I(iris$Species_binary=="yes")~iris$Sepal.Length, family="binomial")
Call: glm(formula = I(iris$Species_binary == "yes") ~ iris$Sepal.Length,
family = "binomial")
Coefficients:
(Intercept) iris$Sepal.Length
-27.829 5.176
Degrees of Freedom: 149 Total (i.e. Null); 148 Residual
Null Deviance: 191
Residual Deviance: 71.84 AIC: 75.84
はい、それはです。もちろん、数値変数も機能します。
これは他のほとんどのパッケージ/関数でも同様ですが、いくつかの動作が異なる可能性もあります。ロジスティックリンクが二項族のデフォルトであることに注意してください。なぜなら、これを指定する必要がなかったからです。
このようにすれば、正のレベルとしてカウントされる因子のレベルがわかっていることを確認してください。それ以外の場合、結果の解釈は逆になります。
ありがとうございます。 プロジェクトのソリューションの1つでは、さらに進める前に数値に変換されているのを見ましたか?しかし、どのような推奨方法がありますか、あるいは、ほとんどの人が標準に従うと思いますか?私はRと統計を学び始めており、ベストプラクティスに興味があります。 – lak3567bo
結論、変数が正しいクラス(例えば、 'factor')である限り、再コード化する必要はありません。 –