2017-04-20 22 views
-1

sklearn kmeans documentationによると、k-meansにはshape =(n_samples、n_features)の行列が必要であると言われています。しかし、shape =(n_samples、n_samples)という距離行列を用意しました。ここで、各インデックスは2つの文字列間の距離を保持しています。時系列はSAX表現を使用して文字列に変換されています。距離行列をsklearnのk-平均クラスタリングに渡す

距離行列を使用してクラスタリングを実行すると、良好な結果が得られます。これにはどのような理由がありますか?私が知る限り、K-medoidsは距離行列で動作するものです。

答えて

1

K-meansは、名前が示すとおり、を意味します。を意味します。

算術平均を計算するには元のフィーチャにアクセスする必要があり、距離行列は使用できません。

K-手段は、ペアの距離を使用しません。したがって、距離行列はこのアルゴリズムでは役に立たない。

代わりに、階層型クラスタリングなどの別のアルゴリズムを選択してください。

関連する問題