MatlabでK平均アルゴリズムをプログラミングする際に質問があります。 K-meansアルゴリズムが細長いデータセットを分類するのに適していないのはなぜですか?クラスタリング長さのあるデータセットのK平均アルゴリズム
-3
A
答えて
-2
0
目的関数を見て、x軸を10倍にスケールすると、100倍重要になります。
"長い"データでは、 "長い"ディメンションは結果にほとんどの影響を与え、他は無視される傾向があります。
k-meansは監督されていないアルゴリズムなので、これに対抗するために重みを学習することはできません。線形SVMや決定木などの分類器でこれを行うことができるため、この問題は発生しません。
関連する問題
- 1. k-平均クラスタリングのJaccard
- 2. IDLでのK平均クラスタリング
- 3. K平均クラスタリングKDDcup99データセットエラー
- 4. PCA K-平均クラスタリング前
- 5. グループ平均クラスタリングのアルゴリズム的複雑度
- 6. k-meansアルゴリズムを使用した画像データセットのSURFフィーチャのクラスタリング
- 7. K平均クラスタリングによるセントロイドの計算と表現
- 8. 半監督k平均クラスタリングの実行方法
- 9. 距離行列をsklearnのk-平均クラスタリングに渡す
- 10. VGG機能のK平均クラスタリングが機能しない
- 11. K平均クラスタリングとベクトル量子化の違いは?
- 12. Gensim Doc2vecモデルがK平均にクラスタリングする
- 13. K平均クラスタリング、クラスタ数よりも少ないサンプル数
- 14. 反転距離を使用したK平均クラスタリング
- 15. Python:どのようにk平均アルゴリズムを使用してクラスタリング間の類似性を比較するには?
- 16. K平均アルゴリズムのシード値を入れる方法は?
- 17. k平均アルゴリズムの重心と重心の差
- 18. 不均一クラスタによるクラスタリング(k-means)
- 19. スパークk平均OutOfMemoryError
- 20. K平均クラスタリング、なぜクラスタの初期位置が最終的なクラスタリング結果に影響を与えるか?
- 21. 平均ワード長
- 22. LDA/Biクラスタリング/ K平均を使用して時間的クラスタリングを行う方法R?
- 23. k-平均クラスター化のテストデータ分類
- 24. 各k秒/ msでの平均tcpdump/
- 25. スパークK平均クラスタメンバーを取得する
- 26. K平均色クラスタリングを意味する - マスクされたnumpy配列を持つ背景ピクセルを省略する
- 27. Netlogoの平均リンク長コードスニペット
- 28. MATLABで事前に定義されたシードを使用してK平均クラスタリングを使用する
- 29. k-ary検索の平均比較がk * ln(N)/ ln(k)であるのはなぜですか?
- 30. k平均クラスタリングのmatlabの二乗誤差の総和を計算するには?
[Cross Validated](http://stats.stackexchange.com)の質問ではありませんか? – jeff