2017-11-23 8 views
0

私はpysparkにある特定のUDFの引数としてリストを渡す必要があります。例:pysparkでUserDefinedFunction(UDF)にリストを渡す方法

def cat(mine,mine2): 
    if mine is not None and mine2 is not None: 
      return "2_"+mine+"_"+mine2 

udf_cat = UserDefinedFunction(cat, "string") 

l = ["COLUMN1","COLUMN2"] 

df = df.withColumn("NEW_COLUMN", udf_cat(l)) 

いつもエラーが表示されます。

答えて

1

私が必要とするのは、リストの前に文字 '*'を使用してリストを渡すことです。例:

df = df.withColumn("NEW_COLUMN", udf_cat(*l)) 

これでうまくいきます。

関連する問題