DOB、Gender、State、pincode、transaction_id、promocodeなどの属性を持つ特定のデータセットに基づいて顧客をグループ化しようとしています。K平均アルゴリズムのシード値を入れる方法は?
シルエットスコアには大きな違いがあります。前のものからのクラスタリング、すなわち結果は一貫していない。 これはおそらく、データセットに対するランダムなシードのためです。アルゴリズムに属性を渡す行は次のとおりです。
km1 = KMeans(n_clusters=6, n_init=25, max_iter = 600)
クラスタを割り当てるか、毎回の後、私はプログラムを実行するように最適化する方法はあります、スコアが一貫して良いですか?
私はscikit-learnでPython 3を使用しています。
ここではどのような言語とフレームワークを使用していますか? Scikitを学ぶPythonですか?明確にしてください(特定のタグ付けも仕事をすることができます)... – desertnaut