1
スパークRDDの列の値を直接合計する効率的な方法はありますか?私はこれのためだけにSQL DataFrameを作成したくありません。スパークRDD:SQL DataFrameを作成せずに1つの列を合計
私は、各LabeledPointが疎ベクトル表現を使用するLabeledPointのRDDを持っています。私が最初の特徴の値の合計に興味があるとします。
次のコードは、私のために動作しません:
//lp_RDD is RDD[LabeledPoint]
var total = 0.0
for(x <- lp_RDD){
total += x.features(0)
}
totalAmtの値を、このループはまだ0