0

私はAmazon Web Service Machine Learningサービスのパイロットを務めています。私はいくつかのスープを持っています。AWS Machine Learning Serviceのパフォーマンス結果の解釈方法を教えてください。

私はバイナリクラシファイアモデルを使用していますが、得られた結果のヒストグラムは数値結果と一致しません。ヒストグラムによれば、偽陽性の分布は真陰性の分布よりも高いが、数値的結果はこの挙動を示さない。

Histogram

  • 778個の真陽性
  • 15178真の陰性
  • 6663偽陽性
  • 173偽陰性は

誰もがこの問題にいくつかの洞察をもたらすことができますか?

は、あなたがカットオフスコア(縦線)上のコントロールを持っていて、右から左へとその逆からそれを移動させることができ、

答えて

0

これは、Amazon Webサービスのサポートチームからの私の質問への答えです:

一部が周り掘り行った後、私はY軸のスケーリングは、ヒストグラムのため 対数であることがわかりました、なぜ真の否定と偽陽性の比較が直接の1:1の領域 が数値結果と一致しないのかを説明します。を表示しなかった場合対数スケール、私の推測では、ほとんどのY軸が であり、真の否定結果と真の肯定結果があり、偽の肯定結果と偽陰性は目立たないほど小さすぎる可能性があります。

リファレンス:Y軸は対数である場合https://forums.aws.amazon.com/message.jspa?messageID=733706

結果を提供ヒストグラムと一致しました。

0

、ありがとうございました。ダイアグラムでは、カットオフスコアを左に移動しました。これは、ほとんどの場合、はいを予測することを意味します。したがって、偽陽性(間違って陽性と予測されます。彼らのフォーラムを通じて

+0

回答ありがとうございますが、ここでの問題はネガティブな観測ヒストグラム内です。添付画像に見られるように、0.02の閾値と負の観測ヒストグラムのみを考慮すると、閾値の左側でカバーされる面積は右側の面積よりかなり小さい。これは、得られた結果と一致しません。 15,178真のネガティブ(しきい値の左側の領域) 6,663誤検出(しきい値の右側の領域) –

+0

真のネガ(灰色の領域あなたはおそらく多くのゼロまたはゼロに近い値を持っているからです。 偽の予測(偽陰性= 173および偽陽性= 6,663)を比較すると、カットオフラインの左右のこれらの縞状領域の比率を簡単に確認できます。 – Guy

+0

私は本当のネガティブをすべて見ることができないのは意味をなさないと思います。ゼロが多く、ゼロに近い値がある場合、ヒストグラムは非常に高い数値でなければなりません。そうでしょうか?垂直軸のスケールが対数でない限り! –

関連する問題