2016-12-21 26 views
1

私は同じ変数で2つの線形回帰の係数を比較しようとしていますが、異なるサブグループに対して実行しています。モデル1の係数がモデル2の係数と等しいかどうかを確認したいと思います。それぞれの係数について知る必要があります。異なる回帰の係数を比較する

マイ再現性のあるデータ:

Data <- data.frame(
gender = sample (c("men", "women"), 2000, replace = TRUE), 
var1 = sample (c("value1", "value2"), 2000, replace = TRUE), 
var2 = sample (c("valueA", "valueB"), 2000, replace = TRUE), 
y = sample(0:10, 2000, replace = TRUE) 
) 

私は2つの回帰を実行します。基本的には

men <- subset(Data, gender =="men") 
women <- subset(Data, gender =="women") 

lm.men <- lm(y~var1+var2, data = men) 
summary(lm.men) 
lm.women <- lm(y~var1+var2, data = women) 
summary(lm.women) 

を、私がテストしたい場合:

  • 係数var1lm.men =係数var1中で
  • 係数lm.menvar2 =係数、私の2つの標本が異なっているので、私は、anova()機能を使用することはできませんlm.women

var2。私はFテストを適用すべきだと思うが、私はこのテストのための機能を見つけることができない。

誰も私の問題を解決する方法を知っていますか?

+2

これは、「交差検定」問題のより多くの、そして(http://stats.stackexchange.com/questions/13112/what [はすでに答えを持っている]です - 重要な違いをテストするための正しい道であるか - それでは係数) – Barker

+0

oops。少なくとも私の答えは、CV答えに含まれていないRコーディングの詳細を与えます。 –

答えて

2

@Barkerがコメントで指摘しているように、この質問の統計的部分はalready answered on CrossValidatedです。いくつかのRコーディングの詳細をここに追加します。変数ごとの男女相互作用モデルに適合し、(var1var2の効果は、男性と女性の間で大きく異なるのですか?」)これらの質問に答えると相互作用項を試験するために

Data <- data.frame(
    gender = sample (c("men", "women"), 2000, replace = TRUE), 
    var1 = sample (c("value1", "value2"), 2000, replace = TRUE), 
    var2 = sample (c("valueA", "valueB"), 2000, replace = TRUE), 
    y = sample(0:10, 2000, replace = TRUE) 
) 
mm <- lm(y~(var1+var2)*gender,Data) 
ここ

は、相互作用項である:

interax <- c("var1value2:genderwomen","var2valueB:genderwomen") 
printCoefmat(coef(summary(mm))[interax,]) 
##      Estimate Std. Error t value Pr(>|t|) 
## var1value2:genderwomen 0.20144 0.28241 0.7133 0.4758 
## var2valueB:genderwomen -0.15423 0.28266 -0.5456 0.5854 
+0

多くのありがとう@ベン!結果を正しく解釈するのを手伝ってください。あなたのサンプルでは、​​ 'Pr(> | t |)'が0.10を超えているため、var1が男性と女性で大きく異なると結論付けてください。 –

+0

これらは、相互作用がない(すなわち、変数の効果が両方の性別で同じである)帰無仮説の検定のための標準的なp値である。大きなp値は、帰無仮説が棄却できないことを意味します(データを分析する前に、あなたの基本統計知識を間違いなく改善/更新する必要があります...) –

+1

また、性別の違いが来たことを確信していますすべての値が無作為にサンプリングされたため、その例では重要ではありません。 – Barker

関連する問題