2016-09-01 4 views
0

私は以下の点について非常に感謝しています:私はANOVA(aov)を実行して大きなデータセットのサブセットのp_valueを検索しています。だから私は数値変数/値が等しく36である部分集合にぶつかりました。ループANOVAの一部であるので、一見無限小のp_value 1.2855e-134を報告するとともに実行されます - >私がいれば私を修正してください間違っていますが、p_valueが小さければ小さいほど、要素間の差が大きく異なる確率は高くなりますか?簡単にするためにRのANOVA(AOV関数):誤ったp_valueが等しい値で報告されました

このサブセットされています sUBSET_FOR_ANOVA

ここでは、私はANOVAを計算し、TEMP_DF2あなたは添付資料参照サブセットだけでp_valueのを取得する方法である:

anova_sweep <- aov(TEMP_DF2$GOOD_PTS~TEMP_DF2$MACH,data = TEMP_DF2) 
p_value <- summary(anova_sweep)[[1]][["Pr(>F)"]] 
p_value <- p_value[1] 

ガードありがとうございました。

答えて

0

あなたの所見を複製することはできません。のは、すべての値が36であることを例データセットを作成してみましょう:

df <- data.frame(gr = rep(letters[1:2], 100), 
       y = 36) 
summary(aov(y~gr, data = df)) 

与える:

   Df Sum Sq Mean Sq F value Pr(>F) 
gr   1 1.260e-27 1.262e-27  1 0.319 
Residuals 198 2.499e-25 1.262e-27    

を基本的には、サンプルサイズに応じて、我々は0.3かそこらの周りにp値を求めます。グループ分散の間とその間の分散が等しいため、F統計は(定義により)常に1です。

誤解を招く結果がありますか?ある程度、はい。推定されたSSおよびMSは0でなければならず、aovは非常に小さいと計算する。 Rのいくつかの他の統計的テストおよびいくつかのパッケージでは、分散がゼロであることを確認し、エラーを生成するでしょうが、aovは明らかにそうではありません。

しかし、もっと重要なのは、あなたのデータがANOVAの前提条件に違反していると言えます。したがって、結論の根拠に信頼できるものはありません。統計的テストに関するRの期待は、通常、正しい状況でテストを採用することがユーザーにあります。

+0

ありがとう、私は分散がequal.Manyどこにこれを説明するために再びANOVAを実行するためにサブセットを除外する必要があります... – Tamas

関連する問題