2017-03-08 10 views
1

を取得し、私はAKが私のデータセットを使用してモデルを意味し、今私はクラスタIDクラスタとクラスタのID関数kmeansスパークの最初の要素

val clusters = KMeans.train(data, numClusters, numIterations) 

val vectorsAndClusterIdx = data.map{ point => 
    val prediction = clusters.predict(point) 
    (point.toString, prediction) 
} 

とともに、各クラスタからいくつかの要素を取得したいしかし、私いったんでしょう訓練を受けましたこれらの要素をクラスターIDで印刷する方法がわかりません

答えて

1

私が理解していれば、割り当てられたクラスターIDで各ポイントを印刷したいと考えています。

あなたはこのような何かを試みることができる:

vectorsAndClusterIdx.collect().foreach(println(_)) 

それともそれが良いだろう。

println(dataClustered.collect().mkString("\n")) 
+0

を可能な場合は、あなたの最初のソリューションは、私は希望だけで何:)素晴らしい作品、ありがとうございました、各クラスターから10個の要素を取得する –

+0

@ laure-d:もし上の答えで大丈夫なら、plsは投票に気をつけて/答えを受け入れる –

+0

私は完全には言っていないが、私は10を得ることに感謝する可能であれば、各クラスタからの要素ではなく、すべての要素ではない –

関連する問題