データフレームに追加する列が5つあります。 (A - E)これらの列の値は(a - e)変数に格納されます。データフレームに新しい列を追加するためのPyspark UDFの作成方法
代わりの
df.withColumn("A", a).withColumn("B", b).withColumn..... etc
を使用して、我々は、UDFでこれを行うことができますか?
現在、私が命名した機能:
def add_col(df_name,newCol,value):
df = df_name
df = df.withColumn(newCol, value)
return df
しかし、私はUDFに変換し、それを使用する方法を理解することはできませんよ。助けてください。あなたが複数の列を追加したい場合は
をUDFが1つの以上の列を生成することはできません...しかし、あなた複雑な列(配列または構造体の型)を返すことがあります。しかし、明らかに定数(リテラル)値で作業しているので、UDFを使用する点はありません –