私はAmazon Web Service Machine Learningサービスのパイロットを務めています。私はいくつかのスープを持っています。AWS Machine Learning Serviceのパフォーマンス結果の解釈方法を教えてください。
私はバイナリクラシファイアモデルを使用していますが、得られた結果のヒストグラムは数値結果と一致しません。ヒストグラムによれば、偽陽性の分布は真陰性の分布よりも高いが、数値的結果はこの挙動を示さない。
- 778個の真陽性
- 15178真の陰性
- 6663偽陽性
- 173偽陰性は
誰もがこの問題にいくつかの洞察をもたらすことができますか?
は、あなたがカットオフスコア(縦線)上のコントロールを持っていて、右から左へとその逆からそれを移動させることができ、
回答ありがとうございますが、ここでの問題はネガティブな観測ヒストグラム内です。添付画像に見られるように、0.02の閾値と負の観測ヒストグラムのみを考慮すると、閾値の左側でカバーされる面積は右側の面積よりかなり小さい。これは、得られた結果と一致しません。 15,178真のネガティブ(しきい値の左側の領域) 6,663誤検出(しきい値の右側の領域) –
真のネガ(灰色の領域あなたはおそらく多くのゼロまたはゼロに近い値を持っているからです。 偽の予測(偽陰性= 173および偽陽性= 6,663)を比較すると、カットオフラインの左右のこれらの縞状領域の比率を簡単に確認できます。 – Guy
私は本当のネガティブをすべて見ることができないのは意味をなさないと思います。ゼロが多く、ゼロに近い値がある場合、ヒストグラムは非常に高い数値でなければなりません。そうでしょうか?垂直軸のスケールが対数でない限り! –