2016-11-26 5 views
1

私は自分のデータセットでクラスタリングしています。ggplot Rプロット後のkはクラスタリングを意味します

今私は、クラスタリングをプロットしたいと、このコードで:

ggplot(mydata, aes(SalesRank, PageRank, colour= booksCluster$cluster))+ geom_point() 

私はこの結果を得る:

enter image description here

今、私が代わりにクラスタの番号の第3列にしたいです私の元のデータセット(例えば、 'XY')の。

どうすればこの問題を解決できますか?

編集:

ここでは、あなたがbooksCluster$clusterのレベルの名前を変更する必要があります私のデータ

$ SalesRank: int 18083 9284 15794 14630 -1 23395 12095 991 653 33717 ... 
$ PageRank : num 0.01 0.01241 0.00753 0.00454 0.00301 ... 
$ Verlag : Factor w/ 58 levels "-1TION-Z","A-1conda",..: 40 33 33 33 33 57 33 

答えて

0

です。これがまだ要素でないなら、あなたはそれを一つに強要しなければならないでしょう。 levels(bookClusters$cluster) <- c(...)を使用できます。...は新しい名前のベクトルです。

+0

申し訳ありません私は全く新しいですので、あなたのアドバイスを理解していません。 – moses

+0

@NicoHoppel要因[here](https://www.stat.berkeley.edu/classes/s133/factors.html)と[ここ](http://stackoverflow.com/questions/29711067/r-どのように変化のファクタ名のレベル)。 –

+0

ああ大丈夫です。今私はベクトルとして20の名前をタイプする必要がありますか? – moses

関連する問題