2017-09-14 4 views
0

私はfrom pyspark.ml.clustering import KMeansライブラリを使用してKMeansクラスタリングを行います。私はを確実にして、クラスターが10回だけ移動し、に10回移動します。これにはどのパラメータを使用する必要がありますか?私にとっては、それはmaxIter=10でなければならないと思いますが、わかりません。どちらが最高ですか? maxIter=10またはinitSteps=10クラスタの動きを修正するPySpark

答えて

0

initStepsは、KMeansで初期化ステップを実行する回数に関係します。 maxIterは反復回数の最大値ですが、実行されます。目的のために、initSteps=10を設定しても、ではクラスタが10回だけ移動することは保証されません。私はPySparkで例を見つけることができませんでしたが、Sklearnの場合、KMeansの初期化の効果をthis exampleに見ることができます。

関連する問題