これは既に質問されていますが、回答を正しく理解できませんでした。Apache Sparkで2つのRDDに参加する
RDD_FINAL(col1,col2,col3,colA,colB,colC)
があります:
は、私は次のようにそれらを結合する必要が同じ列数やレコード
RDD1(col1,col2,col3)
と
RDD2(colA,colB,colC)
の同じ番号を持つ2 RDDSを持っていますkey
レコード間の結合を実行するが、それらは順番に並んでいる。つまり、RDDの最初のレコード1はRDD2の第1のレコードに対応する。
RDDは行の内部順序を保持しません。あなたの質問は率直に答えるにはかなり広いです。あなたの質問を見直してください! – eliasah
また、SOの質問方法についてもお読みください。 http://stackoverflow.com/help/how-to-ask – eliasah
@eliasah回答してガイドをいただきありがとうございました...実際にはこれらの2つのrddは2つの異なるテキストファイルから来ています...私が必要とする唯一のことは、カラム... 1つの理由は、 "col1とcolA"を比較することです...私は私のデータセットがsqlのプライマリキーのようなIDキーを持っていないが、結合操作を試したいと思った。 –