Apache Spark 2.0 Dataframe/Dataset APIを使用しています 値リストからデータフレームに新しい列を追加します。私のリストは与えられたデータフレームのような同じ数の値を持っています。Apache Sparkリスト/配列から新しい列をSparkデータフレームに追加する方法
val list = List(4,5,10,7,2)
val df = List("a","b","c","d","e").toDF("row1")
私のような何かをしたいと思います:私はGREATFULだろう任意のアイデアについて
val appendedDF = df.withColumn("row2",somefunc(list))
df.show()
// +----+------+
// |row1 |row2 |
// +----+------+
// |a |4 |
// |b |5 |
// |c |10 |
// |d |7 |
// |e |2 |
// +----+------+
を、実際に私のデータフレームは、多くの列が含まれています。
リストとDFのサイズが異なる場合はどうなりますか?より大きいコレクション(N =短いコレクションのサイズ)の最初のN個のアイテムのみを含めますか? –
私の場合、常に同じ長さになることはわかっています –
リストをデータフレームにも変換できます。次に両方にrow_numberを追加し、row_numberで結合します。 –