0
pysparkデータフレーム内の異なる列に異なる集約関数を適用しようとしています。 stackoverflowの上のいくつかの提案に続いて、私はこれを試してみました:異なる列での集計操作の違いpyspark
"基" the_columnsまたはthe_columns2いずれかに存在列ではありませんdf.groupby(*group).agg(*exprs)
続い
the_columns = ["product1","product2"]
the_columns2 = ["customer1","customer2"]
exprs = [mean(col(d)) for d in the_columns1, count(col(c)) for c in the_columns2]
。これは動作しません。異なる列で異なる集計関数を実行するにはどうすればよいですか?