私が使用しているデータセットは以下のとおりです。あなたが見ることができるように、k-meansクラスタ分析は、これらのクラスタの中心を容易に見つけると考えるでしょう。しかしK平均クラスタリングでデータ内のすべてのクラスタが見つかりません
、私はクラスター分析をKが-意味し、私はこれを取得センターをプロットし実行します。
私は基本的な関数kmeansコード使用しています:関数kmeansについてはほとんど知られて事実が信頼性の高い結果を得るために、あなたは多くのランダムな初期化で繰り返しアルゴリズムを実行する必要があるということです
cluster <- kmeans(mydata,90)
cluster$centers
関数kmeansは、決定論的なアルゴリズムではありませんが、初期のセンターのランダム性は、最終的に影響を与える必要があります結果。期待される結果が得られた場合は、初期中心を事前に定義するか、別のアルゴリズムを探します。 – Dave2e
約5,000データポイントです。しかし、それらは構造化されたクラスタ(1クラスタあたり約40〜60データポイント)に配置されます。 – tylerp
別のクラスタリングアルゴリズムを使用してセンターを見つけようとしましたが、センターをk-meansに送信しましたか? [例えば。 h-cluster](https://stackoverflow.com/questions/44547697/cluster-algorithm-with-levenshtein-distance-and-additional-features-variables/44551452#44551452) – AkselA