2つのデータフレーム、df1
とdf2
があります。新しい列を2番目の列に追加したいと思います。この新しい列は、最初のデータフレームからの列の平均である必要があります。このような何か:Spark(Java) - 単一の平均を新しい列として追加する
df1 df2 df2
userid count value userid count userid count value
11 2 5 10 1 10 1 5
22 3 4 20 1 ======> 20 1 5
33 5 6 30 1 30 1 5
私が働いていない
df2 = df2.withColumn("value", avg(df1.col("value")));
をしようとしています。これどうやってするの? ありがとうございました!
操作を行う前に、両方のデータフレームに参加する必要があります。スパークはdf1をdf2に関連付ける方法を知らない。 –
ああ結局、私は '.unionAll()'を1つのdfにしたいと思っていたので、退屈なようですが、同じ列がない限りはできません。 –
私はあなたが試した問題だと思います解決するためにhttp://stackoverflow.com/a/29950853/702002と関連している –