2017-03-22 4 views
0

rmseの代わりにcount:poissonを使用しているときに、私はnloglikelihoodという値を見ています。今私はrmseまたはmaeとそれらの数字を比較する方法がわかりません。xgboostポアソンランのnloglikelihood値の直観

実際には、rmseやMaeで得られる誤差の直感は得られませんが、それほど優れていません。例えば

- >train-poisson-nloglik:2.01885 val-poisson-nloglik:2.02898

ここでは、我々は実際の値は2.02エラーによって異なり、言うことができます。 誰かが小さな例で説明することはできますか?おかげさまで

答えて

0

値の計算には良い記事がありますhere

ただ、より網羅的であるように、値は次のとおりです。

mean(factorial(label) + preds - label*log(preds)) 

あなたは負の対数尤度の真の式と比較した場合meanの代わりにsumにする必要があります。私は列車と試験値がより匹敵するように平均を取ることを選択したと思います。

最後に、質問に答えるために、尤度はデータが特定のパラメータを持つ分布から来た確率です。ポアソンモデルでは、パラメータは単なる予測のセットです。したがって、あなたの予測が良いほど、確率が大きいほど関連する負の対数尤度は小さくなります。

rmseまたはmaeは、予測と真実の違いの期待に基づいていますが、負の対数尤度は確率を見ています。