2017-03-31 19 views
1

それでは、私は、次の2つのRDDSを持っているとしましょう: (これらはそれぞれRDDのための唯一の最初の数行です)Spark(Scala)で2つのRDDを結合する方法は?

RDD1:

Time     Temp 
2014-08-12 13:20:00 22 
2014-08-12 13:21:00 24 
2014-08-12 13:24:00 26 
2014-08-12 13:26:00 27 
2014-08-12 13:28:00 22 

RDD2:

Time     Age 
2014-08-12 13:20:00 45 
2014-08-12 13:21:00 45 
2014-08-12 13:24:00 46 
2014-08-12 13:26:00 37 
2014-08-12 13:28:00 122 

そしてI RDD2の列がRDD1に追加されるようにそれらを結合したいと考えます。私は組合を使うことができません。それはRDD1の底にRDD2を追加するだけですが、それが理にかなっていれば、それを「側面」に追加したいと思います。

+0

それらに参加する必要があります –

答えて

5

joinこれらを「横並び」にすることができます。ドキュメントから:

"タイプ(K、V)と(K、W)のデータセットで呼び出された場合、各キーのすべての要素のペアを含む(K、(V、W))ペアのデータセットを返します。外部結合はleftOuterJoin、rightOuterJoin、およびfullOuterJoinによってサポートされます。 "

関連する問題