2016-11-09 6 views
1

非常に基本的な質問:scikit learn/pandas/pythonを使用して、どのクラスタのサンプル/観測値/行を出力するか?

いずれかのクラスタに所属する観測値を印刷するにはどうすればよいですか?

data = pd.read_csv('my_file.csv') 
X = data[['Var1','Var2','Var3']] 
ms = MeanShift() 
ms.fit(X) 
labels = ms.labels_ 
cluster_centers = ms.cluster_centers_ 

私はいずれかのクラスタのための「VAR1」、「VAR2」、「VAR3」の値を見てみたいと思います。

答えて

2

データセットの予測を表示するように思えます。例えば、

df['y_pred'] = y_pred 

を、必要に応じて、あなたのデータフレームをフィルタリング:

y_pred = ms.predict(X) 

あなたは、この操作を行って、サンプルにこれらをリンクできます。これは、次のように行うことができますクラスタ1のサンプルを見る:

df[df.y_pred == 1] 
+0

素晴らしいと思います! –

関連する問題