-2
map、mapValues、sortを試しましたが、何も動作しません。 質問は次のように記述されます: "類似性(値の2番目のもの)、同じ場合は、最小のID(値の最初のもの)を持つユーザーを選択してください。 そして、キーと値のペアのリストは、次のとおりです。このソートプロセスをpysparkで実行する方法は?
[
(18, [(2, 0.5)]),
(30, [(19, 0.5), (6, 0.25)]),
(6, [(30, 0.25), (20, 0.2), (19, 0.2)]),
(19, [(30, 0.5), (8, 0.2), (6, 0.2)]),
(2, [(18, 0.5)]),
(26, [(9, 0.2)]),
(9, [(26, 0.2)])
]
私が取得したい:
[
(18, [(2, 0.5)]),
(30, [(19, 0.5), (6, 0.25)]),
(6, [(30, 0.25), (19, 0.2)]),
(19, [(30, 0.5), (6, 0.2)]),
(2, [(18, 0.5)]),
(26, [(9, 0.2)]),
(9, [(26, 0.2)])
]
はあなたにたくさんありがとうございました!