2017-08-28 9 views
0

2つのデータフレームのケースとコントロールがあり、以下のように2つのサンプルt検定を行いました。 (1299個のフィーチャ/カラム)のため、各フィーチャのp値を計算します。各フィーチャに対して生成されたp値に基づいて、帰無仮説を拒否または受け入れる必要があります。2つのサンプルt検定を使用してRの各フィーチャのp値を計算する方法

以下の出力がどのように解釈され、どのように各フィーチャのp値を計算するかは誰にも分かりますか?

t.test(New_data_zero,New_data_one) 
    Welch Two Sample t-test 

data: New_data_zero_pca and New_data_one_pca 
t = -29.086, df = 182840000, p-value < 2.2e-16 
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval: 
-0.02499162 -0.02183612 
sample estimates: 
mean of x mean of y 
0.04553462 0.06894849 

答えて

1

?t.testを参照してください。 xとyは行列ではないベクトルとする。したがって、関数は自動的にベクトルに変換します。何をしたい、列が特長であり、2つのマトリックスは、同じ機能を持っている、と仮定:

pvals=vector() 
for (i in seq(ncol(New_data_zero))){ 
pvals[i]=t.test(New_data_zero[,i], New_data_one[,i])$p.value 
} 

その後、あなたは(おそらく対数スケールで)pvalsを見て、複数の仮説検定補正後(見ることができますか? p.adjust)。

0

あなたの機能の違いを見つけるこのアプローチの非常に悪い考えにも取り上げましょう。これらの1299個のフィーチャの間の効果のすべてが文字通り0であっても、可能なすべての1299個の2ウェイ比較のうち0.05個で有意な結果が得られます。私は入門的な統計テキスト、とりわけ家族的なタイプIの誤り率に関するセクションを進める前に検討することを強く勧めます。

関連する問題