私を許して、私は非常にこれに新しいです。多くの列で自動機能を実行するR
私は、300の変数、いくつかの結果/症状(従属変数)といくつかの入力(独立変数)の150,000の観測値を持つデータテーブルを持っています。 )。それぞれの症状について、説明的な統計と、各入力への関連性のカイ2乗検定の結果が必要です。
わかりやすい統計情報については、「symptom.matrix」という結果変数のマトリックスを作成し、「適用」を使用してこれを管理しました。
Desc.stats<-matrix(c(apply(symptom.matrix,2,sum),
apply(symptom.matrix,2,mean),
apply(symptom.matrix,2,function(x)
{return(sqrt((mean(x)*(1-mean(x)))/length(x)))})),
ncol=3,
dimnames=list(c(...),
c("N","prev","s.e."))); Desc.stats
カイ二乗を得るために、私は次のように成果と入力の個々のペアにchisq.testを使用しますが、私はsymptom.matrix
result1<-(chisq.test(symptom1,input1));
print (c(result1$statistic, result1$p.value))
にこれを適用する方法を見ることができません
これは、symptom.matrixで動作するようにどのようにスケールアップするのですか? chisq.testを使用することは可能ですか?それとも、自分自身の統計情報を作成するための基礎に戻るのが良いでしょうか?
方法*症状を提示してください*と* input *はデータテーブルで識別されます。それらは接頭辞/接尾辞ですか? 'dput(head(mydatatable))' – Parfait
_symptoms_と_input_は、データテーブルでそのように識別されません。そこで、私はデータテーブルから症状を呼んだ: 'symptom.matrix <-with(mydatatable、matrix(c、Vision、Voice、Del、Paranoia、...)、ncol = 8))' –
*? – Parfait