1000インスタンスを含む5つのクラスのトレーニングデータセットを、たとえばk-meansを使用して5つのクラスタ(センター)にクラスタ化したとします。次に、テストデータセットで検証することによって混乱行列を作成しました。私はそれからROC曲線をプロットしたいと思いますが、どうすればそれが可能ですか?分類またはクラスタリングの結果からのROC曲線
0
A
答えて
2
ロック曲線は、True PositiveとFalse Positive Rateのトレードオフを示します。換言すれば
ROCグラフは、TP速度が Y軸上にプロットされていて、離散的な分類器を使用する場合FPレートが ROC Graphs: Notes and Practical Considerations for Researchers
X軸上にプロットされた2次元グラフでありますその分類器は、ROC空間内の単一点のみを生成する。通常、確率を生成する分類子が必要です。 TPおよびFPレートが変更されるように、クラシファイアでパラメータを変更します。その後、このポイントを使用してROC曲線を描きます。
あなたはk-meansを使用します。 K-手段は離散的にクラスタメンバーシップを与えます。ポイントはClusterAまたはClusterEに属します。したがって、k-meansからROC曲線を出力することは容易ではありません。 Lee and Fujita には、このためのアルゴリズムが記載されています。彼らの論文を見るべきです。しかしアルゴリズムはこのようなものです。
- k平均
- テストデータを用いて計算TPとFPを適用します。
- 1つのクラスタから2つ目のクラスタへのデータポイントのメンバーシップを変更します。
- 再びテストデータを使用してTPとFPを計算します。
あなたは、彼らがROCスペースでより多くのポイントを取得見たようおよびROC曲線を描くために、これらのポイントを使用し
関連する問題
あなた「1つのクラスタから二番目のクラスタにデータポイントの変更メンバーシップ」はどうすればよいですか?ランダムにデータポイントを選択し、それをランダムなクラスタに割り当てるか、どうやって行うのですか? – shn
論文によれば、彼らはクラスタメンバーシップがシフトしたときにポイントを選ぶが、k-は全体の目的関数があまり変わらないことを意味する。 –