0

はすべき:バイナリログの損失は、yに基づいて方程式の1つの部分を除外しますか?ログ損失方程式を仮定

logLoss=−(1/N)*∑_{i=1}^N (yi(log(pi))+(1−yi)log(1−pi))

Nは、 yi...yiNは、従属変数の実際の値をサンプル数である

、及びpi...piNは、ロジスティック回帰からの予測可能性である

方法私はそれを見ている:

の場合yi = 0最初の部分yi(logpi) = 0

あるいは、除外される式のy一部の値に応じて、ここでyi = 1第2部分(1−yi)log(1−pi) = 0

場合。私はこれを正しく理解していますか?

私の究極の目標は、ログ消失の結果をどのように解釈するかを理解することです。

答えて

1

はい、あなたは正しい方向にあります。 p_i=P(y_i=1)を覚えておいて、基本的に考えれば、損失関数は、予測が実際のラベルと一致しないタプルをペナルティするように定義する必要があるということです(例えば、y_i=1では、p_iが低く、 y_i=1p_iが高い場合(例えば、y_i=1と高い場合は、の部分によって、またはと高い場合は、の部分が処理されます)と同時に、実際のラベルに一致する予測をタプルにペナルティを課すべきではありませんまたはy_i=0およびp_iが低い場合)。

ロジスティック回帰(cross entropy)の損失関数は、次の図からわかるように、損失関数の上記の望ましい特性に正確に対応しています。

enter image description here

+1

ありがとうございます。単純な精度スコアほど直感的ではありません。しかし、私はそれがp_iに応じてどのように不正確な結果をもたらすかを知る –