0
で元のデータを修正、私はいくつかの基本的な階層的クラスタリングを実行するには、このおもちゃのコードを使用しています:は、クラスタインデックス
library(dplyr)
library(ggplot2)
OrginalData <- read.table("https://s3.amazonaws.com/Somewhere/IrisTabSepData/IrisData.txt",
header = TRUE, sep = "\t")
SubsetData <- subset(OrginalData, select = c(
#"SepalLength"
#,"SepalWidth"
"PetalLength"
,"PetalWidth"
))
clusters = hclust(dist(SubsetData), method = 'average')
plot(clusters)
clusterCut <- cutree(clusters, 3)
table(clusterCut, OrginalData$Species)
ggplot(OrginalData, aes(PetalLength, PetalWidth, color = OrginalData$Species)) +
geom_point(alpha = 0.4, size = 3.5) + geom_point(col = clusterCut) +
scale_color_manual(values = c('black', 'red', 'green'))
は、上記で作成したクラスタを含む元のデータフレームOrginalDataに追加の列を追加することが可能ですコード(この場合は3〜3)をcsvファイルとして書きますか?
'OriginalData $ clusterCut = clusterCut' ' write.csv(OriginalData、 "EnhancedIris.csv"、row.names = FALSE) ' – G5W
感謝。いくつかのスペルミスがありましたので、ここに作業コードがあります:OrginalData $ clusterCut = clusterCut write.csv(OrginalData、 "EnhancedIris.csv"、row.names = FALSE)。あなたは答えを書こうと思いますか? – cs0815