2017-11-05 5 views
0

は、私はこのようになります賃金と呼ばれるデータセットを持って言う:誤差が正規分布しているかどうかを判断するためにRを使用した:

wage 
# A tibble: 935 x 17 
    wage hours iq kww educ exper tenure age married black south urban sibs brthord meduc 
    <int> <int> <int> <int> <int> <int> <int> <int> <fctr> <fctr> <fctr> <fctr> <int> <int> <int> 
1 769 40 93 35 12 11  2 31  1  0  0  1  1  2  8 
2 808 50 119 41 18 11  16 37  1  0  0  1  1  NA 14 
3 825 40 108 46 14 11  9 33  1  0  0  1  1  2 14 
4 650 40 96 32 12 13  7 32  1  0  0  1  4  3 12 
5 562 40 74 27 11 14  5 34  1  0  0  1 10  6  6 
6 1400 40 116 43 16 14  2 35  1  1  0  1  1  2  8 
7 600 40 91 24 10 13  0 30  0  0  0  1  1  2  8 
8 1081 40 114 50 18  8  14 38  1  0  0  1  2  3  8 
9 1154 45 111 37 15 13  1 36  1  0  0  0  2  3 14 
10 1000 40 95 44 12 16  16 36  1  0  0  1  1  1 12 
# ... with 925 more rows, and 2 more variables: feduc <int>, lwage <dbl> 

は、私は、単純な線形回帰ところで賃金とIQを見て言ってやるがいい。

m_wage_iq = lm(wage ~ iq, data = wage) 
m_wage_iq$coefficients 
私を与え

## (Intercept)   iq 
## 116.991565 8.303064 

私はエラーがあることを確認したい:

ϵi∼N(0,σ2) 

Rを使用してこれを確認するにはどうすればよいですか?

+3

'plot(m_wage_iq)'は、​​これを助けることができる診断プロットを提供します(または少なくともこれを理解すること)。 – Marius

+3

私の意見では、質問は「Rでそれを行う方法」ではなく「静的にそれをやりたい」ということです。分位数 - 分位グラフ、シェイプロロ - ウィルク検定、コルモゴロフ - スミルノフ検定など多くの方法があります。それで、Rでそれを行う方法を見つけるのは非常に簡単です。 – JRR

+0

また、プレディクタなどに対する残差プロット – SmallChess

答えて

1

試してみる方法はいくつかあります。

正常性をテストする方法の1つはshapiro.testです。 A p.valueがアルファレベル(通常は最大10%)を超えると、帰無仮説(すなわち、エラーが正規分布している)を拒否できないことを意味します。しかし、テストはサンプルサイズに偏っているので、QQplotを見て結果を強化したいかもしれません。

m_wage_iqplot(m_wage_iq))をプロットし、2番目のグラフを見ると分かります。あなたのポイントがほぼx = yの線の上にある場合、それは誤差が正規分布に従うことを示唆します。

+0

どうすれば2番目のグラフを得ることができますか? plot(m_wage_iq)は私に4つのグラフを与えます。私はどのようにして2番目のものだけを得るのですか? – Jwan622

+1

'plot(m_wage_iq、which = 2)'を試すことができます。 – LyzandeR

+1

これは地獄としてのドープです。 – Jwan622

関連する問題