クラスタの数を求めるアルゴリズムを構築しようとしています。私は初期の手段としてデータセットからランダムなポイントを割り当てる必要があります。Python:パンダのデータフレームからランダムに10個の値を取得
Iは、第一次のコードを試みた:それは範囲エラーのうち指標を与え
mu=random.sample(df,10)
を。
Iはnumpyの配列にそれを変換して
mu=random.sample(np.array(df).tolist(),10)
代わりに、それは私の値の10の配列を与えている意味として10の値を与えるをしました。
データフレームから10個のクラスタの平均値として初期値を取得するにはどうすればよいですか?