KMeansアルゴリズムの品質を理解する

Unbalanced factor of KMeansを読んだ後、私はこれがどのように機能するかを理解しようとしています。つまり、私の例では、要因の価値が低いほど、KMeansのクラスタリングの品質が向上し、クラスタのバランスがより良いことがわかります。しかし、この要素の裸の数学的解釈は何ですか？これは分かっている量なのでしょうか？ここでKMeansアルゴリズムの品質を理解する

私の例は以下のとおりです。

C1 = 10 
C2 = 100 

pdd = [(C1,10), (C2, 100)] 
n = 2  <-- #clusters 
total = 110 <-- #points 
uf = 10 * 10 + 100 * 100 
uf = 100100 * 2/12100 = 16.5

C1 = 50 
C2 = 60 

pdd = [(C1, 50), (C2, 60)] 
n = 2   
total = 110 
uf = 2500 + 3600 
uf = 6100 * 2/12100 = 1.008

C1 = 1 
C2 = 1 

pdd = [(C1, 1), (C2, 1)] 
n = 2  
total = 2 
uf = 2 
uf = 2 * 2/2 * 2 = 1

出典

2016-08-31 gsamaras

また使用ジニ指数、エントロピーの尺度に関連すると思われます平方数の合計。

をCross Validated: Understanding the quality of the KMeans algorithmとする。

出典

2016-09-01 16:51:52 gsamaras

KMeansアルゴリズムの品質を理解する

答えて

関連する問題