0

私は不均衡データセットでランダムなフォレストモデルを実行します。私はAUCと混乱行列のセットを得た。 AUCは悪くないようではありませんでしたが、実際にはすべてのインスタンスを正と予測します。どのようにしてAUCを正しく使用するのか?この場合のAUCスコアの解釈方法は?

enter image description here

次のようにROC曲線:

enter image description here

+0

クロス投稿:https://stackoverflow.com/q/41132399/781723、https://datascience.stackexchange.com/q/15725/8560。 [複数のサイトに同じ質問を投稿しない](https://meta.stackexchange.com/q/64068)誰も時間を無駄にすることなく、それぞれのコミュニティは答えに正直な打撃を与えるべきです。 –

答えて

0
あなたのデータが1つの方向または小さな偽陽性率と類似の他の(一種で歪んでいるとき、あなたは、この問題を持つことができます

まれな条件のための医療検査ではひどいです)。 AUCサマリースコアだけでなく、レシーバの動作特性曲線(ROC曲線)全体を見ると役立ちます。

+0

データの不均衡が「歪んだ」ことを意味しましたか? – LUSAQX

+0

私は意図的に漠然とした言葉を使用していました。なぜなら、私はこれについてかなり専門家ではなく、私は危険であると知っていますし、(b)私が見ていないデータについてはコメントすることが難しいからです。 ROC曲線のプロットを作成して投稿することができれば、私(または他の人)が問題の解釈に役立つかもしれません。 –

関連する問題