2016-08-31 13 views
0

Unbalanced factor of KMeansを読んだ後、私はこれがどのように機能するかを理解しようとしています。つまり、私の例では、要因の価値が低いほど、KMeansのクラスタリングの品質が向上し、クラスタのバランスがより良いことがわかります。しかし、この要素の裸の数学的解釈は何ですか?これは分かっている量なのでしょうか?ここでKMeansアルゴリズムの品質を理解する


私の例は以下のとおりです。

C1 = 10 
C2 = 100 

pdd = [(C1,10), (C2, 100)] 
n = 2  <-- #clusters 
total = 110 <-- #points 
uf = 10 * 10 + 100 * 100 
uf = 100100 * 2/12100 = 16.5 

C1 = 50 
C2 = 60 

pdd = [(C1, 50), (C2, 60)] 
n = 2   
total = 110 
uf = 2500 + 3600 
uf = 6100 * 2/12100 = 1.008 

C1 = 1 
C2 = 1 

pdd = [(C1, 1), (C2, 1)] 
n = 2  
total = 2 
uf = 2 
uf = 2 * 2/2 * 2 = 1 

答えて

関連する問題