1
私はRで問題が発生しており、何が起こっているのかはよく分かりません。同じ変数に回帰とt.test
を実行すると、t.test
が〜100人の参加者(DFはt検定では283.93、回帰では382)が落ちていることが分かり、異なるpvaluesが得られます。しかし、私がフルサンプルのために個別に手段を計算すると、t検定に表示されるのと同じです。t.test参加者をRに落とす
誰でも何が起こっているのか説明できますか?以下は、回帰とt検定の両方のコードと出力です。 DVは1から7の変数であり、IVは1/0のダミーであることに注意してください。
回帰出力
Call:
lm(formula = confident ~ get.surgery, data = d)
Residuals:
Min 1Q Median 3Q Max
-4.2989 -0.7767 0.2233 0.7011 1.7011
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.29893 0.07714 68.692 < 2e-16 ***
get.surgery 0.47777 0.14895 3.208 0.00145 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.293 on 382 degrees of freedom
Multiple R-squared: 0.02623, Adjusted R-squared: 0.02368
F-statistic: 10.29 on 1 and 382 DF, p-value: 0.001451
とt検定
t.test(confident ~ get.surgery, data = d)
Welch Two Sample t-test
data: confident by get.surgery
t = -3.6106, df = 233.93, p-value = 0.0003737
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.7384624 -0.2170709
sample estimates:
mean in group 0 mean in group 1
5.298932 5.776699
これをプログラミングの質問にするには、実際に[再現可能な例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)を提供する必要があります。しかし実際には、各テストの自由度がどのように計算されるかを理解する上で、統計上の問題に似ているようです。これは、統計的な質問がトピックになっている[stats.se]の方がおそらくよくなる質問です。 – MrFlick
私はこれがプールされた分散の問題かもしれないと思います。あなたのt.testをvar.equal = TRUE(デフォルトはFALSE)で試してみてください。 – Joy
@喜び - それがそれを解決しました!どうもありがとうございます! –