1
私はpysparkデータフレームに以下のudf関数を持っています。コードはmyFun1('oldColumn')
がnullの場合を除いて正常に動作しますが、出力をnullではなく空の文字列にします。pyspark/dataframe:nullを空のスペースに置き換えてください。
myFun1 = udf(lambda x: myModule.myFunction1(x), StringType())
myDF = myDF.withColumn('newColumn', myFun1('oldColumn'))
別のudf関数を作成する代わりに、これを行うことはできますか?ありがとう!