2016-07-16 14 views
1

私は、UCIリポジトリのGlassデータセットのスペクトルクラスタリングを試みています。あなたはガラスのデータを知っている場合は9つの属性"RI""Na""Mg""Al""Si""K""Ca""Ba"、および"Fe"を持っています。私は結果を得るために、以下のように、スペクトルクラスタリング「specClust」を持っている"kknn"パッケージを使用しています:GlassデータのR - スペクトルクラスタリング

library(kknn) 
data(glass) 
specClust(glass[, 1:9], centers=2, nn=50, iter.max=30) 

しかし、結果に、私は、クラスタが2つの属性手段を取得しています以下の通り:

 [,1]  [,2] 
1 0.9096567 -0.3331058 
2 0.5101274 0.8273862 

私はK平均クラスタリングを実行しているとき、Rコンソールは次のように9属性のクラスタ手段を返しています:

 RI  Na  Mg  Al  Si   K  Ca  Ba 
1 1.519226 13.7124 0.210400 1.837800 72.87120 0.4910000 10.160400 0.56580000 
2 1.518103 13.3150 3.438841 1.325122 72.58378 0.4989024 8.590061 0.05591463 
     Fe 
1 0.0480000 
2 0.0597561 

"kknn"パッケージのスペクトラルクラスタリングが、2つの属性に対してのみクラスタを意味する理由を知りたいと思います。私は理由を見つけようとしましたが、成功しませんでした。

私はすべての助けを感謝します。すべての助けを進んでいただきありがとうございます。

答えて

3

全体的に2つのクラスタの統計を調べていました。

これは、あなたが、より探していた何を与える必要があります:

pacman::p_load(kknn) 
data(glass) 
cl <- specClust(glass[, 1:9], centers=2, nn=50, iter.max=30) 
pcol <- as.character(glass$Type) 
pairs(glass[2:10], pch = pcol, col = c("green", "red")[cl$cluster]) 
table(glass$Type, cl$cluster) 

aggregate(glass[,2:10],by=list(cl$cluster),mean) 
Group.1  RI  Na  Mg  Al  Si   K  Ca   Ba   Fe 
1  1 1.519061 13.81638 0.9115942 1.746232 72.6613 0.4652174 9.729130 0.534202899 0.04318841 
2  2 1.518035 13.21345 3.5282069 1.301517 72.6460 0.5122069 8.589517 0.004137931 0.06358621 

enter image description here

関連する問題