上のクラスタリングがデータセットのクラスタリングは、(私はScikitを学ぶ使用しています)このKは私がKを使用する必要が不均一なサイズのクラスター
のように見えます。しかし、私は適用されたときにKが、それは私に重心を与えるものではありません意味意味意味予想通り。間違って分類されます。 また、私がscikitで正しく分類されていないポイントを知りたければ、そのアイデアはどのようになるでしょうか。 ここにコードがあります。
km = KMeans(n_clusters=3, init='k-means++', max_iter=300, n_init=10)
km.fit(Train_data.values)
plt.plot(km.cluster_centers_[:,0],km.cluster_centers_[:,1],'ro')
plt.show()
ここでtrain_dataはパンダフレームであり、2つのフィーチャと3500サンプルを持ち、コードは以下のようになります。
ため、私は初期の重心の悪い選択で起こったかもしれないけど、何が解決策になるだろうか?
私の結果です。 – Farseer
@Farseer私はそれを追加しました。 – Hima