2016-07-22 5 views
0

ています:は、私はK-手段によりクラスタリングを行うことをscikit-学ぶ使用の重要性

from sklearn import cluster 
k = 4 
kmeans = cluster.KMeans(n_clusters=k) 

をが、別の質問です: 計算に学ぶscikit使用する方法k-手段の重要性を意味する?

+1

です。クラスタリングの設定でどのような特徴の重要性があるのか​​説明できますか? – cel

+0

この質問に対する回答には統計の概念の説明が必要なので、[CrossValidated](http://stats.stackexchange.com)の方が適切かもしれません。 – C8H10N4O2

答えて

2

残念なことに、私の知る限りでは、k-meansアルゴリズムの文脈では、「特徴の重要性」というものはありません - 少なくとも、機能の重要性は「自動関連性の決定」以下のリンクのように)。

実際には、クラスタリングの手順はデータポイントとクラスタセンター間のユークリッド距離()に依存するため、k-meansアルゴリズムはすべてのフィーチャを等しく扱います。

さらに一般的には、自動特徴選択または自動関連性決定を行うクラスタリングアルゴリズム、またはクラスタリングのための一般的な特徴選択方法が存在する。具体的な(任意の)例は Roth and Lange, Feature Selection in Clustering Problems、NIPS 2003

関連する問題