2017-05-21 8 views
-1

データのマトリックスをクラスタリングするためにPAMを実行します。PAMの "K"の正しい値を選択

しかし、今私は正しい方法で "K"値を選択する方法を理解していません。

これは、クラスタの最大数です。

最後に、ClusGapの前にPAMを実行する必要がありますか?

ありがとうございます!これらヒューリスティック

答えて

0

あなたは通常

  1. は、すべてが最大までkのクラスタリングアルゴリズム(K-手段、PAM)を複数回実行します(彼らは最高の真のkを選択することができない場合があります)。
  2. すべてのkについて、SSQ(k-meansの場合)またはTD(PAM)の方がベストです。
  3. は、その後、あなたがすべての結果
  4. プロットヒューリスティックに応じて、統計
  5. のカーブのためにあなたのヒューリスティックの統計量を計算し、膝/肘/最小/最大値を選択してください。
  6. よく似ている場合は、クラスタリングアルゴリズムが正しく動作しない可能性があります。はすべてです。前処理を変更するか、他のアルゴリズムを試す必要があります。
関連する問題