-1

私には私の心を失わせる問題があります。私のラップトップとクラスタ上で結果が異なります

私はmllibから関数kmeansを使用するアプリケーションを持っていると私は私ののラップトップ上でそれを起動した場合は私に結果を与え、AWSからクラスタに私に別の完全異なるを与えます。実際、ラップトップとAWSクラスタで何度も立ち上げた結果、各プラットフォームの結果は似ていますが、どちらのプラットフォームでも同じでなければなりません。

私はRepartitionを使用していません。デフォルトパラメータで実行しています。

ありがとう

+0

K平均がランダム化されています。異なる結果をもたらすはずです。 –

+0

はい、そうです。しかし、私が言ったように、私はラップトップとAWSクラスタで何度も立ち上げました。各プラットフォームの結果は似ていますが、どちらのプラットフォームでも似ているはずです。 –

+1

バグかもしれませんか?スパーククラスタリングはやっかいです。 –

答えて

0

スパークKmeansは初期重心をランダム化します。ランダムシードを固定値に設定してみてください。

val kmeansModel = new Kmeans().setSeed(1L).setK(k) 
関連する問題