2017-12-11 23 views
-2

kモードが適用された後、すべてのクラスタのパラメータをどのように変化させるか? kモードのクラスタリングを適用し、CLUSPLOTを使用してクラスタをプロットし、クラスタが重なり過ぎるようになった。テストするには、すべてのクラスタで変数の分散を求める必要があるt検定を適用したいと考えました。しかし、我々は分類データを有するので、どのように分散を計算すべきか?kモード後の分散計算R

My attempt to calculate variance and t-test

+0

データと一緒に再現可能な例は、あなたを助けてくれるでしょう。 –

+0

ちょうど私の以前の投稿に画像を追加しました –

+0

あなたのデータを 'dput'できます –

答えて

0

分散、およびclusplotもほとんどが連続変数のために理にかなっている、この考え方に基づいています。それは最小二乗推定に根ざしているので、正方形と平方根を計算するために何かが必要です。

これらをカテゴリ変数またはバイナリ変数に適用しようとすると、通常は良い結果が得られません。だからあなたはあなたのドメイン/アプリケーションに合ったアプローチを考えなければならないでしょう。分散の "ターンキー"ソリューションはできません。

+0

私はスマートデバイスを使用するユーザーの好みをモデリングしています。私はkモードが過去にプライバシー設定に適用されているのを見ました。そこで彼らはパラメータの分散を計算し、その後はウェルチt検定とは異なっていた。 –