0
50,000件近くのレコードを含むデータセットを分析しようとしています。私は解析サーバーとK-meansにアルゴリズムを設定しました。しかし問題は、レコードの大部分が1つのクラスター(ほぼ48,000レコード)になるということです。 SPSSのような別のアプリケーションでクラスタリングすると、それは私に受け入れられる結果をもたらしました。私はデータセットを用意して異常値を除去しましたが、問題はまだ解決されていません。だから、私はこの問題に対処する考えがあるかどうか尋ねたいのですが?K-のSingeltonクラスタはSQL Serverのssasを意味します