私は、ggplot2を使って6つのデータ変数の対のプロットを作成しようとしています。私は非常に印象的な「GGally」パッケージのドキュメンテーションとAdam Laiacano [http://adamlaiacano.tumblr.com/post/13501402316/colored-plotmatrix-in-ggplot2]の非公式修正を読みました。残念ながら、どちらの方法でも目的の出力を得る方法が見つかりませんでした。k-meansクラスタによるggplotのプロット行列の着色?
#The Swiss fertility dataset has been used here
data_ <- read.csv("/home/tejaskale/Ubuntu\ One/IUCAA/Datasets/swiss.csv", header=TRUE)
data_ <- na.omit(data_)
u <- c(2, 3, 4, 5, 6, 7)
x <- data_[,u]
k <- 3
maxIterations <- 100
noOfStarts <- 100
filename <- 'swiss.csv'
library(ggplot2)
library(gridExtra)
library(GGally)
kmeansOutput <- kmeans(x, k, maxIterations, noOfStarts)
xNew <- cbind(x[,1:6], as.factor(kmeansOutput$cluster))
names(xNew)[7] <- 'cluster'
kmeansPlot <- ggpairs(xNew[,1:6], color=xNew$cluster)
OR
kmeansPlot <- plotmatrix(xNew[,1:6], mapping=aes(colour=xNew$cluster))
両方のプロットが作成されますが、クラスタに応じて色付けされていません - :ここでは
は、サンプルコードです。
私はフォーラムでこの質問に対する回答を見逃しておらず、本当に謝罪しています。どんな助けも高く評価されます。
ありがとうございます!
通常のplotコマンドでも、 'col'パラメータにclusterIDを渡すことでこれを行うことができます。 –
答えをくれてありがとう、@ ThomasJungblut。しかし、私はそれを完全に理解しているかどうかはわかりません。ファセットの使用をアドバイスしていますか?私はfacet_gridで試してみましたが、http://stackoverflow.com/questions/1313954/plotting-two-vectors-of-data-on-a-ggplot2-scatter-plot-using-rで与えられた例を使用しています。彼らは私の目的を果たしていません。私があなたの提案をより良く理解するためには、最小限の例があります。もう一度ありがとう! –
これは、クラスタによって着色されたポイントの通常の散布図です。通常のkmeansのdocを見てください:http://stat.ethz.ch/R-manual/R-devel/library/stats/html/kmeans.html下の方: 'plot(x、col = cl $ cluster) '' cl $ cluster'はクラスタへの割り当てです。 –