なぜRDDs
をdataframes
に変換し、union
機能を使用してください。
dataframe
に変換するのは簡単です。import sqlContext.implicits._
を入力し、.toDF()
の機能をheader names
に適用するだけです。例えば
:
val sparkSession = SparkSession.builder().appName("testings").master("local").config("", "").getOrCreate()
val sqlContext = sparkSession.sqlContext
var firstTableColumns = Seq("col1", "col2")
var secondTableColumns = Seq("col3", "col4")
import sqlContext.implicits._
var firstDF = Seq((1, 2), (2, 3), (3, 4), (2, 3), (3, 4)).toDF(firstTableColumns:_*)
var secondDF = Seq((4, 5), (5, 6), (6, 7), (4, 5)) .toDF(secondTableColumns: _*)
firstDF = firstDF.union(secondDF)
あなたがRDDs
よりもdataframes
で動作することは非常に簡単なはずです。 dataframe
をRDD
に変更することも非常に簡単です。.rdd
関数を呼び出すだけです。
val rddData = firstDF.rdd