2017-05-16 1 views
2

私はデータを分析するためにkmeansクラスタリングを行っています。これまで完璧に働いています。kはクラスタリング制限を意味しますか?

library(Ckmeans.1d.dp) 
file=read.csv(file.choose(),header=T) 
attach(file) 
sortfile=file[order(normalized),] 
results=Ckmeans.1d.dp(normalized,3) 
plot(results) 

は今、私は、クラスタ、およびセンターを取得することができるんだけど、私は、クラスタの「限界」を得ることにもっと興味: これはこれまでのところ、私のコードです。私が使用したデータの中で1つのクラスタの最大値ではなく、私が現在持っているクラスタの限界です。それは可能ですか?どうすればいい?

答えて

1

K-meansラベルは、最も近い重心(クラスタ中心)に基づいています。したがって、クラスタ間の「限界」(決定境界と呼ばれる)は、少なくとも2つの異なる重心が最も近い重心(例えば、それらと正確に同じ距離)を有する点である。

たとえば、2Dでは、平面上の各点について、最も近い重心を計算します。それが複数ある場合(例えば、少なくとも2つの重心がそれから最小距離にある場合)、それは決定境界の一部である。

関連する問題