私はクラスタ化するためのカテゴリ変数のセットを持っているので、私はgithub packageから取られたkモードを使用しています。私は、各観測値(ポイント)の距離を、それが属するクラスターの重心に近づけたいと思います。Kモード各点とクラスタの重心間の距離を計算する
kmodes_cao = kmodes.KModes(n_clusters=6, init='Cao', verbose=1)
kmodes_cao.fit_predict(data)
# Print cluster centroids of the trained model.
print('k-modes (Cao) centroids:')
print(kmodes_cao.cluster_centroids_)
# Print training statistics
print('Final training cost: {}'.format(kmodes_cao.cost_))
print('Training iterations: {}'.format(kmodes_cao.n_iter_))
を変数はカテゴリなので、私はEucledean距離を使用することはできません。
これは私がこれまでに実施したものです。各点のクラスタ重心までの距離を計算する理想的な方法は何ですか?
ルック助けるバイナリ距離 ホップで1 あります'KModes'関数です。車輪を再構築しないでください。 –
私はそれを見渡しましたが、距離の計算方法はわかりませんでした。私は新しいデータマイニングを使用しているので、あなたがガイドしてくださいできますか? –
これはドキュメントの 'cat_dissim'パラメータでさえあります。 –