2016-05-27 10 views
-1

別のデータフレームの列に値をマップすることを試みています。Spark DataFrameの行の値を列にマップする方法は?

私は、次のデータフレームを持って、「ID」の値が一意であることが知られている:

sqlContext.createDataFrame(Seq(("a", 1),("b",2))).toDF("id","number") 

そして:

sqlContext.createDataFrame(Seq(("jane",10),("John",12))).toDF("mcid", "age") 

そして、私は、スキーマとデータフレームを生成したい:

| mcid | age | a | b | 
+1

を。両方のDataFramesに参加しますか?表示されている例で期待される結果は何ですか? –

答えて

0

あなたが何をしようとしているのかわかりませんが、あなたはこれを持っていると仮定しています:

val df1 = sqlContext.createDataFrame(Seq(("a", 1),("b",2))).toDF("id","number") 
val df2 = sqlContext.createDataFrame(Seq(("jane",10),("John",12))).toDF("mcid", "age") 

これはあなたが捜しているスキーマを持つDataFrameなります。もう少し自分の仕事について明確にしてください

df2.join(df1).groupBy($"mcid", $"age").pivot("id").sum("number") 
+0

ありがとう、私の質問に答えます。 – cootersan

関連する問題