2017-09-23 3 views
0

で元のデータを修正、私はいくつかの基本的な階層的クラスタリングを実行するには、このおもちゃのコードを使用しています:は、クラスタインデックス

library(dplyr) 
library(ggplot2) 

OrginalData <- read.table("https://s3.amazonaws.com/Somewhere/IrisTabSepData/IrisData.txt", 
        header = TRUE, sep = "\t") 

SubsetData <- subset(OrginalData, select = c(
#"SepalLength" 
#,"SepalWidth" 
"PetalLength" 
,"PetalWidth" 
)) 

clusters = hclust(dist(SubsetData), method = 'average') 
plot(clusters) 

clusterCut <- cutree(clusters, 3) 
table(clusterCut, OrginalData$Species) 

ggplot(OrginalData, aes(PetalLength, PetalWidth, color = OrginalData$Species)) + 
    geom_point(alpha = 0.4, size = 3.5) + geom_point(col = clusterCut) + 
    scale_color_manual(values = c('black', 'red', 'green')) 

は、上記で作成したクラスタを含む元のデータフレームOrginalDataに追加の列を追加することが可能ですコード(この場合は3〜3)をcsvファイルとして書きますか?

+0

'OriginalData $ clusterCut = clusterCut' ' write.csv(OriginalData、 "EnhancedIris.csv"、row.names = FALSE) ' – G5W

+0

感謝。いくつかのスペルミスがありましたので、ここに作業コードがあります:OrginalData $ clusterCut = clusterCut write.csv(OrginalData、 "EnhancedIris.csv"、row.names = FALSE)。あなたは答えを書こうと思いますか? – cs0815

答えて

1

既に作成した変数clusterCutにはクラスタが含まれています。単にdata.frameに追加し、write.csvを使用してデータを保存することができます。これは素晴らしい作品

OrginalData$clusterCut = clusterCut 
write.csv(OrginalData, "EnhancedIris.csv", row.names=FALSE) 
関連する問題