2017-01-25 12 views

答えて

3

外積でbroadcastを使用して、追加のアクションを回避することが可能である:

import org.apache.spark.sql.functions.broadcast 

df.crossJoin(broadcast(df.agg(avg("date")))) 

か:

spark.conf.set("spark.sql.crossJoin.enabled", true) 

df.join(broadcast(df.agg(avg("date")))) 

あなたはをしないでくださいは、ウィンドウ関数を使用している:

df.withColumn("avg", avg("date").over()) 

関連する問題