2017-11-04 14 views
-1

私はRを使っているのですか?私はいくつかのデータサンプルでクラスタリングをしようとしています。 私はR - DBSCAN fviz_cluster - dim1とdim2を使ってelmeentsの座標を取得します。

res.pca <- PCA(df, 
       ncp = 5, # nb composantes principales. 
       graph = TRUE, 
       ) 

、PCAを試みたと私はこれは素晴らしいです

res.pca$ind 

使用して新しい座標との完全な要素のリストを取得することができます。 PCAで2番目の軸を使用して情報を完全に で処理すると、1軸に80%のばらつきがあり、2番目の軸に10%を超えるビットがあります。私は30の変数を持っていることを考慮して、結果を非常に誇りに思っていました...そして、終わりでは、PCAは暗黙のうちに2次元で十分であると言います。

これらのデータを使用して、私はDBSCANクラスタリング方法を試しました。 FPC :: DBSCANライブラリ(factoextra)

db <- fpc::dbscan(df, eps = 22, MinPts = 3) 

とDBSCANを行うと、二次元表示が言うfviz_clusterを使用してクラスタをグラフ化した後 :軸1と軸2上の6.7%の92.8パーセント!!!! (2軸で説明したばらつき合計の99%以上!

要するに、DBSCANはPCAよりも優れていると思われる方法で30変数データを変換しました。

私の問題は、私がこれらの新しい座標にアクセスしたいということです...しかし、現時点では... 私が見ることができる唯一のアクセス可能な変数 db $ cluster、db $ eps、db $ Minpts、db $ isseed。

しかし、いくつかのデータがアクセス可能であると思われます。どのようにfviz_clusterがデータを表示するか。

答えて

1

投影はdbscanによって行われません。 fviz_clusterは、データ上でstats::prcompで取得した最初の2つのコンポーネントを使用します。

+0

ありがとうございました。私はそれをチェックするつもりです。 –

関連する問題