2011-12-02 13 views
1

K平均法と連続K平均法を同じ初期設定で同じデータセットに適用すると、同じ結果が得られますか?あなたの理由を説明してください。K-meansとシーケンシャルK-meansの結果は同じですか?

個人的に私は答えがいいえだと思います。シーケンシャルなK平均で得られる結果は、データポイントの提示順序によって決まります。終了条件は同じではありません。

ここでは、2つのクラスタリングアルゴリズムの疑似コードが添付されています。

Make initial guesses for the means m1, m2, ..., mk 
Until there is no change in any mean 
    Assign each data point to the cluster whose mean is the nearest. 
    Calculate the mean of each cluster. 
    For i from 1 to k 
     Replace mi with the mean of all examples for cluster i. 
    end_for 
end_until 

連続K-手段

Make initial guesses for the means m1, m2, ..., mk 
Set the counts n1, n2, ..., nk to zero 
Until interrupted 
    Acquire the next example, x 
    If mi is closest to x 
     Increment ni 
     Replace mi by mi + (1/ni)*(x - mi) 
    end_if 
end_until 

答えて

5

が修正K平均、結果が異なっていてもよいです。 (0,0)、x2 =(1,1)、x3 =(0.75,0)、x4 =(0.25,1); x1 =(0,0)、x2 =(1,1)、x3 =(0.75,0)、x3 = m1 =(0,0.5)、m2 =(1,0.5)。 K-meansは、x1とx4をm1クラスタに割り当て、x2とx3をm2クラスタに割り当てます。新しい手段はm1 '=(0.125,0.5)とm2' =(0.875,0.5)であり、再割り当ては行われません。逐次K平均では、x1が割り当てられた後、m1は(0,0)に移動し、x2はm2を(1,1)に移動する。次に、m1はx3に最も近い平均であるため、m1は(0.375,0)に移動します。最後に、m2はx4に最も近いので、m2は(0.625,1)に移動します。これはやはり安定した構成です。

+0

反例による証拠結婚したことの証拠+1 –

+0

ありがとう、ありがとう。 –

関連する問題