2012-09-17 27 views
7

Rを学び始めたばかりで、データの残差の平均値と中央値を見つけるのに役立つ必要がありました。私は、LMを計算し、要約すると、私は次のような残差を取得:線形モデルからの残差の平均値と中央値

min  1Q  median 3Q  Max 
-111.86 -34.90  -7.6 33.46 182.58 

質問:そう残差の中央値は-7.6ですが、私の平均であるの? 残差の平均と中央値を求める計算がありますか? は私が(残油(trees.lm)を意味するつもりされたか、それは平均値として入力する必要があります(trees.lmの$残油)

私のクラスメートはすべて同じデータセットに対して異なる応答を得るために明確にしてください。

答えて

6

ここにある特定の質問に対する答えは次のとおりです。

mean(resid(trees.lm)) 

あなたはこのような装着モデルオブジェクトを詳細に調べると、任意成分を取り除くべきではありませんGLMのようなもう少し複雑な何かにそうすることであなたをかみます作業残差を抽出したばかりのときは、

glm.mod.obj$residuals 

これはあなたにはあまり役立ちません。

はさえlm()オブジェクトのような単純なもののために、(例えばna.action引数の設定だったか?)モデルが装着されたかに応じて異なるものをresid()を使用したり$residualsにアクセスすることができます。

また、線形モデルは、残差がi.i.dであると仮定します。平均0と分散$ \ hat {\ sigma}^2} $を持つガウス(または通常の)ランダム変数は、平均が0に非常に近いはずです(つまり、非常に非常に非常に0に近いが、浮動小数点演算が有効です)。

+2

モデルが残差の平均にどのように適合するかにかかわらず、ゼロに近くなります。これは、OLSでは決して驚くべきことではありません。 – Max

+0

おっと、私がそれを書いていたときに私の心の中に何かを持っていて、あなたは大丈夫です。私の愚かさを編集する。 –

+0

OLSでは、残差の合計は正確にゼロに等しい。これは、残差の二乗を最小化する特性です。 –

関連する問題