2017-03-01 7 views

答えて

0

あなたは、

from pyspark.sql import functions as f 

df = spark.sparkContext.parallelize([('idx',)]).toDF() 
res = df.withColumn('literal_col', f.lit('strings')) 
res.show(truncate=False) 

# output: 
+---+-----------+ 
|_1 |literal_col| 
+---+-----------+ 
|idx|strings | 
+---+-----------+ 
0

まずリテラル値を追加し、リストからデータフレームを作成したいように見えます:

new_df = spark.createDataFrame([(value,) for value in list], ['id']) 

その後組合双方のデータフレーム:

base.union(new_df).show() 

は、その列の名前を覚えておいてください両方のデータフレームのタイプが同じでなければなりません。

関連する問題