私は、次のようなSparkのキー値のペアを持っているとします。Pyspark(key、value)の対と(key、[値のリスト])の対
[ (Key1, Value1), (Key1, Value2), (Key1, Vaue3), (Key2, Value4), (Key2, Value5) ]
ここでは、これを減らしたいと考えています。
[ (Key1, [Value1, Value2, Value3]), (Key2, [Value4, Value5]) ]
つまり、Key-ValueからKey-List of Valuesです。
マップを使用してこれを行うにはどうしたらいいですか?
私は、これはあなたが探しているものであると信じて:https://stackoverflow.com/a/27002657/8160718 –