0
スパークデータフレームの各列にある別個のアイテムの数を数える方法があるのでしょうか?つまり、このデータセットを考えると、次のとおりです。SparkR。どのようにSpark DataFrameのすべての列の個別の値を数える?
set.seed(123)
df<- data.frame(ColA=rep(c("dog", "cat", "fish", "shark"), 4), ColB=rnorm(16), ColC=rep(seq(1:8),2))
df
私はカウントを取得するにはRで次の操作を行います。
sapply(df, function(x){length(unique(x))})
> ColA ColB ColC
4 16 8
は、どのように私はこのスパークDATAFRAMEのために同じことをやって行くのでしょうか?
sdf<- SparkR::createDataFrame(df)
ご協力いただきまして誠にありがとうございます。前もって感謝します。 -nate
ありがとうございました。私は2分で受け入れます。 – nate