前の質問に基づく:1、2。代わりに、例えば新しい列に追加するPySpark新しい列をデータフレームに追加する
df = spark.createDataFrame(
[(1, "a", 23.0), (3, "B", -23.0)],
("x1", "x2", "x3"))
そして私は新しい列x4
を追加したいが、私は、Pythonのリストの値を持っている:私は、次のデータフレームを持っていると仮定x4_ls = [35.0, 32.0]
。 Sparkデータフレームに新しい列を追加する最善の方法はありますか?私はまた、データフレームdf_x4 = spark.createDataFrame([Row(**{'x4': x}) for x in x4_ls])
に私のリストを変換することができ
## +---+---+-----+----+
## | x1| x2| x3| x4|
## +---+---+-----+----+
## | 1| a| 23.0|35.0|
## | 3| B|-23.0|32.0|
## +---+---+-----+----+
(しかし、私はどのように一緒にデータフレームを連結していない)
:(私はスパーク2.1を使用 ノート)出力は次のようなものでなければなりません
データフレームを連結したり、値をデータフレームに追加したりする簡単な方法がないようです。 – titipata