0
私は(city, person_id, number)
とRDDを持っています。そして、各都市について、最も高い番号の人を探したいと思います。私の最初の考えは、cityをキーとしてreduceByKeyを、値として数値(rdd.reduce((num1, num2) => Math.max(num1, num2))
)を使用することでしたが、person_idをどのように保持するかはわかりません。spark(Scala)を減らすときに列を保存する