0
Unbalanced factor of KMeansを読んだ後、私はこれがどのように機能するかを理解しようとしています。つまり、私の例では、要因の価値が低いほど、KMeansのクラスタリングの品質が向上し、クラスタのバランスがより良いことがわかります。しかし、この要素の裸の数学的解釈は何ですか?これは分かっている量なのでしょうか?ここでKMeansアルゴリズムの品質を理解する
私の例は以下のとおりです。
C1 = 10
C2 = 100
pdd = [(C1,10), (C2, 100)]
n = 2 <-- #clusters
total = 110 <-- #points
uf = 10 * 10 + 100 * 100
uf = 100100 * 2/12100 = 16.5
C1 = 50
C2 = 60
pdd = [(C1, 50), (C2, 60)]
n = 2
total = 110
uf = 2500 + 3600
uf = 6100 * 2/12100 = 1.008
C1 = 1
C2 = 1
pdd = [(C1, 1), (C2, 1)]
n = 2
total = 2
uf = 2
uf = 2 * 2/2 * 2 = 1