2017-05-03 9 views
1

私はKをKの中から選択するのに役立つ「エルボーグラフ」の中にポイントがあるかどうかを調べようとしていますApache KはいくつかのKでWSSSEを増やすことができますか?

しかし、Kが増えるとWSSSEが増加することがあります。私は、Kが増えるにつれてWSSSEが常に減少するという仮定の下にあった。私はPysparkコードと共にこれを示す画像を添付します。 enter image description here

答えて

0

保証されている唯一のものは、各ポイントのためにゼロにSSEをもたらし、あなたは== k個に達したn個の各ポイントは、直接クラスタ重心の上にあるので、あなたがゼロのWSSSEを得るでしょう一度ということですので、 WSSSEも同様です。あなたの関数が非凸である理由は、k-meansがクラスタ重心(種)のランダム初期化を使用し、k-平均の最適化関数が初期クラスタ重心分布に対して非決定論的である(この問題はNP-ハード)。したがって、あなたは、異なる実行で、より低いローカル最適化に終わることができます。ここでは別のthreadです。

関連する問題