0
質問は次のように与えられます:バイナリt-統計量を表現する方法は?
ファイルdiabetes.csvを読んでください。 BMIとアウトカムという2つの変数があります。 0とBMIの標準偏差は、両方の結果について同じである1行動仮説のためのノンパラメトリック2つのサンプル試験データは、いくつかのデータセットである
bmi <- diabetes$BMI
bmi
outcome <- diabetes$Outcome
outcome
n <- length(bmi)
# tstat
tstat <- ???
# Describe the population and draw synthetic samples
f1 <- function()
{
x <- c(bmi, outcome)
x <- sample(x)
m1 <- sd(x[1:n])
m2 <- sd(x[(n+1):length(x)])
return(m1 - m2)
}
# Create sampling distribution
sdist <- replicate(10000, f1())
plot(density(sdist))
# Gap
gap <- abs(mean(sdist) - tstat)
abline(v = mean(sdist) + c(-1,1) * gap, col = "dark orange")
s1 <- sdist[sdist <(mean(sdist - gap)) | sdist >(mean(sdist + gap))]
pvalue <- length(s1)/length(sdist)
pvalue
値:変数成果は、2つのだけの値が上で取ります「糖尿病」と呼ばれる。私の質問は、結果がバイナリであるため、 "t-統計"をどのように表現するかです。