2017-05-02 5 views
0

K平均クラスタリングを使用している間、私は独立変数の上位5と下位5パーセンタイル値を削除しました。 K-meansクラスタリングを使用した後、各データポイントのクラスタを取得します。外れ値のために以前に削除されたデータポイントのクラスタを取得するにはどうすればいいですかKはクラスタリングを意味します

答えて

0

外れ値の扱いでK平均全体を実行してください。アルゴリズムが完了すると(繰り返しごとに異常値が削除されます)、それらを最も近いクラスタに割り当てることができます。この方法では、クラスタ平均は変化しませんが、異常値は適切なラベルを取得します。

+0

こんにちは、複数の変数を使用して距離を計算する必要があるので、クラスタに戻す方法を教えてください。また、正規化された値または正規の値からの距離を計算する必要があります – Rahul

関連する問題