2016-09-15 24 views
0

これは正確に実際の特許請求の範囲と同じ値であるポアソンGLMポアソン予測は

pois.model = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19]+ 
        offset(log(train_claims_ac$Exposition_au_risque)), 
       data=as.data.frame(freq_x_ac), family=poisson(link = log)) 

sum(predict(pois.model,type='response')) 
[1] 2238 

に重みをオフセット設定と設定との間の差がなければならない重量をオフセット。

しかし、私はウェイト代わりのオフセットを使用します。

pois.model2 = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19], 
        weights=train_claims_ac$Exposition_au_risque, 
        family=poisson(link = log)) 

sum(predict.glm(pois.model2,type='response')) 
[1] 2947.749 

私は露出して、この数を乗算し、私は露出して本当の主張を掛けたとき、私はそれの後に同じ値を得ました。しかし、私は本当に理由を知りません。私の意見では、実際のクレームはすでにエクスポージャーに盛り込まれており、たとえそうであっても分割されなければならないでしょう。

最終的には、私は年間のプレミアムを得る必要があります。これは、オフセットアウトカムをエクスポージャーで割ったものです。

+1

のために使用されないであろう再現可能な例私たちはあなたのデータを持っていません。例えば、glm(cyl〜mpg + offset(log(wt))、data = mtcars、family = "poisson") 'と' glm(cyl〜mpg、data = mtcars、weights = wt 、family = "poisson") 'オフセットとウェイトの同じ違いを表示すると、誰でもすぐにそれを再現することができます –

答えて

0

重みとオフセットは同じではなく、ポアソン回帰の重みを使用しないでください。

この定義の重みは、各応答に乗算されるものではありません。それは、それぞれの観測を「信頼する」程度の正確な尺度です。高い体重の観察は、低い体重の観察よりもフィット感に大きな影響を与えます。

glm docs(強調鉱山)を参照してください:

非NULL重みは?異なる観察は(重みの値は分散に反比例すると)異なる分散を有することを示すために使用することができます応答が成功の割合であるとき、二項GLM前重みは試行回数を与えるために使用されています彼らはほとんどそれが最小を作成するために、これらのような質問と良いでしょうポアソンGLM

+0

ありがとうございました!変わったことは、私はPoissonとGamma用のHDtweedieパッケージを使用しており、重量パラメータしか存在しません。 – Zugi

+0

@ Zugi HDtweedieパッケージを簡単に見てみると、*重みはglmと同じ意味です。露出を表現するために '+ offset(log(x))'を試してみることができます –