2016-09-26 10 views
0

これは多分疑問な質問ですが、私は対象を見つけることができません。クラスター番号が既知のクラスを明らかにする方法

私のデータにplantという3つのクラス(varieties)があり、クラスタ分析を行っています。

cut.complete <- cutree(cluster.complete,k=3) 
cc <- table(variety,cut.complete) 
cc 
     cut.complete 
variety 1 2 3 
    AK  46 13 0 
    AF  2 18 50 
    GH  0 26 21 

は、どのように私は、クラスタ2が知られているAFクラスを明らかにしたクラスタであることを知っていますか:私は知らクラスにクラスタを比較するとき、私は次の表を得てきましたか?例えば、クラスター3はAFクラスを明らかにすることができますか?クラスタ1、クラスタ2および3は、それぞれ真の品種AK、AFおよびGHを明らかにしていない場合

、それは私が正しく分類されたサンプルのパーセンテージを計算するために式

100*round(sum(diag(cc))/sum(cc), digits=3) 

を使用しないことを意味します。

ありがとうございます。

答えて

-1

実際には、クラスターラベル3がグランド真理種別AFとGHに一致するよりも一致します。同様にクラスターラベル2は、AFと一致するよりもグラウンドトゥルーバリエーションGHと一致します地面の真実とクラスターラベルの)。

次の例に示すように、クラスターラベルは、実際の(グランドトゥルース)クラスラベルと一致します。ここで、クラスター3はクラスラベルAKと一致します。その行の最大の試合は、クラスタのラベルの例で更新3.

tab 
     cut.complete 
variety 1 2 3 
    AF 110 125 82 
    AK 93 102 130 
    GH 129 103 126 

library(e1071) 
matchClasses(tab) # find which cluster labels match with which class labels 

Cases in matched pairs: 38.4 % 
AF AK GH 
2 3 1 
+0

見つかり –

+0

はそんなにありがとう、それが参考に@lizrell願っていました! – lizrell

関連する問題