私はUDFを作成しましたが、これを結合内の合体の結果に適用しようとしています。 理想的には私は参加時にこれを実行したいと思います:「タスクはシリアライズできません」という例外が発生したため、UDFによるクエリが失敗するのはなぜですか?
def foo(value: Double): Double = {
value/100
}
val foo = udf(foo _)
df.join(.....)
.withColumn("value",foo(coalesce(new Column("valueA"), new Column("valueB"))))
しかし、私は例外Task not serializable
を取得しています。 これを回避する方法はありますか?