0
注文後にRDDを返すにはどうしたらいいですか? 1つの値で注文し、トップの結果を得て、2番目の値で注文したいと思います。例えば ソート後のPysparkリターンRDD
、rdd = sc.parallelize([(1, "a", 10), (2, "b", 9), (3, "c", 8)])
res = rdd.takeOrdered(2, lambda x: x[0]) # sort on first value
# sort on second value
out = sc.parallelize(res).sortBy(lambda x: x[2]).collect()
しかし、私はres
はRDDも持っており、それが1つのステップで行うことができますか?
rdd.takeOrdered(2, lambda x: x[0])\
.sortBy(lambda x: x[2])
ああ、 'zipWithIndex'は私がやろうとしていたもので動作します。ありがとうございます。 – jenesaisquoi
ようこそ。うれしい! – Psidom