1
case class Step (Id : Long,
stepNum : Long,
stepId : Int,
stepTime: java.sql.Timestamp
)
データセット[ステップ]があり、「Id」列に対してgroupBy操作を実行したいとします。 私の出力はDataset [(Long、List [Step])]のようになります。これはどうすればいいですか?Spark GroupBy集計関数
val inquiryStepGrouped: RDD[(Long, Iterable[Step])] = inquiryStepMap.rdd.groupBy(x => x.Id)