0
次のコードでは、IDFおよびTF-IDFベクトルの計算中にデータをシャッフルする必要がありますか?Spark MLlib IDFシャッフルデータはありますか?
val hashingTF = new HashingTF()
val tf: RDD[Vector] = hashingTF.transform(documents)
tf.cache()
val idf = new IDF().fit(tf)
val tfidf: RDD[Vector] = idf.transform(tf)