2017-03-21 11 views
1

ROC CURVE via ROCR私のROC曲線はなぜVのように見えるのですか?

newpred <- c(1, 0 ,0 ,1 ,0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 
0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0,0, 1, 0, 0, 
0, 0,0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0, 
0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 
1,0, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 
1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0)      


     newlab <- c(0, 0 ,0 ,0 ,0 ,0 ,0 ,1 ,0 ,0 ,0 ,0 ,0 ,0, 
        0, 0 ,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
        0 ,0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
        0, 1 ,0, 0 ,0, 0 ,0, 0 ,1, 0 ,0, 0 ,0, 0 ,0, 
        0, 0 ,1 ,0 ,0 ,0 ,0 ,0 ,0 ,1, 
        0 ,1, 0 ,1, 0 ,0, 0 ,0, 0 ,0, 0 ,0, 0 ,0, 0 ,0) 

だから、最初のベクトルは私の予測であり、第二のベクターは、参照です。なぜ私のカーブがVのように見えるのかわかりません。このようなROCカーブは見たことがありません!私のアドバイザーは、ポイントを追加して、グラフをよりスムーズにしたい/より多くのポイントを追加して曲線にすることを望んでいます。私はpROCを使ってグラフを作成しようとしましたが、追加できる唯一の引数は予測と参照でした。

私もROCR

print.cutoffs.at=seq(0,1,by=0.1), text.adj=c(-0.2,1.7)) 

にしようと、どのように私は、曲線を滑らか以上のポイントを追加します。この enter image description here

を得ましたか。

+1

あなたは1つの独立した変数しか持っていませんか?そしてその可変バイナリですか? – Dason

+0

はい、それはバイナリである単一の独立変数です –

+2

それでは、それはすでに得られるほど滑らかです – Dason

答えて

3

アンROCプロットは、あなたが予測確率から行くのいずれかのクラスAまたはクラスBの

方法である応答変数の確率を出力1を意味し、確率的分類器の性能を調べるためのものですハード予測されたクラスラベルへの分割は、カットオフポイントを設定することによって行われます。クラスAにある確率がカットオフより大きい場合は、ラベルAを割り当てます。それ以外の場合はBを割り当てます。 0.5であり、その結果、最も高い確率を有するクラスに観察が割り当てられる。しかし、異なるカットオフ値を使用することからあなたを止めるものは何もありません。高いカットオフ値、例えば0.9を使用すると、Aに割り当てられた観測値はほとんど見られません。これは正しい値であると確信している場合に限り、クラスAに何かをAとラベルするようなものです。逆に低いカットオフを使用する場合は、この場合は、Bが正しい値であると確信している場合にのみ、Bとラベルを付けます。

ROCプロットは、 0から1までのカットオフ値をスライドさせて生成され、得られた予測ラベルが実際とどのように比較されるかを見ることによって、本質的に生成されます。しかし、これは、まず、基礎となる確率予測があることを前提としています。あなたは予測されたラベルしか持っていないので、あなたのプロットは退化しています。

+0

このグラフを使用してモデルの精度について議論することは不適切ですか? (私は混乱マトリクスから出力されたNPV、PPV、特異度、感度、正確さも使用しています) –

+1

あなたのモデルのパフォーマンスを測定する方法について助言が必要な場合は、[stats.SE](https ://stats.stackexchange.com)。あなたが合ったモデルの種類(ロジスティック回帰、樹木、SVMなど)、使用したデータなどを含めてください。 –

+0

しかし、モデルが予測値の_range_を生成できない場合、ROCあなたにはあまり話しません。 –

関連する問題