2つのrdd、1つは辞書のリスト、もう1つは次のようなタプルのリストです -pysparkを使って辞書リストにタプル値のリストを追加するには?
rdd1 = {{'id1'、['string'、 'string'、count]}、{'id2 'id3'、['string'、 'string'、count]}] rdd2 = [(id1、count)、(id2、count)、(id1、count)]、[文字列]、[文字列] id3、count)]
ここで、rdd2からのidがrdd1と一致する場合、rdd2からrdd1にカウントを追加します。 これを達成するために手伝ってもらえますか?
ありがとうございます。
ありがとうJaco。あなたは素晴らしいです。あなたのコードから多くのことを学びました。 –