0
自分のコードにカスタムのDataframe変換がたくさんあります。 最初のグループは、単純なキャストです:Spark(Java)既存のUDF変換からカスタムトランスを作成する
dframe = dframe.withColumn("account_number", col("account").cast("decimal(38,0)"));
第2のグループはUDF-変換である:彼らはすべてのように働いている
(UDF1<Timestamp, Integer>) s -> s.toLocalDateTime().extractMonth()
dframe = dframe.withColumn("month", callUDF(("monthExtractor"), dframe.col("trans_date_t")));
コードはテストです。しかし、私の最終的な目標は、コードからML Pipelineを作成して再利用できるようにすることです。上記のコードをさまざまなトランスフォーマに変換する方法はありますか?
[UDFからカスタムトランスフォーマを作成するにはどうすればいいですか?](http://stackoverflow.com/questions/35180527/how-to-create-a-custom-transformer-from-a-udf) –
例を見つけました:http://supunsetunga.blogspot.ru/2016/05/custom-transformers-for-spark.html –