2
sparklyrでgroup_by()およびmutate()関数を使用してグループ内の行を連結しようとしています。私はそれが生成したいのですがどのようなSparklyr:group_byを使用し、グループ内の行の文字列を連結します。
library(sparkylr)
d <- data.frame(id=c("1", "1", "2", "2", "1", "2"),
x=c("200", "200", "200", "201", "201", "201"),
y=c("This", "That", "The", "Other", "End", "End"))
d_sdf <- copy_to(sc, d, "d")
d_sdf %>% group_by(id, x) %>% mutate(y = paste(y, collapse = " "))
がある:私は次のエラーを取得する
Source: local data frame [6 x 3]
Groups: id, x [4]
# A tibble: 6 x 3
id x y
<fctr> <fctr> <chr>
1 1 200 This That
2 1 200 This That
3 2 200 The
4 2 201 Other End
5 1 201 End
6 2 201 Other End
:ここ
は、私が動作するはずだと思うのではなく、単純な例ですError: org.apache.spark.sql.AnalysisException: missing) at 'AS' near '' '' in selection target; line 1 pos 42
data.frameで同じコードを使用すると、正常に動作することに注意してください。
sql
ステートメントにあなたのコマンドを変換する - あなたはそれ故に、これは普通の
dataframe
と
dplyr
に動作しますが、
SparkDataFrame
ではない理由を集約せずに、集計関数を使用する場合
d %>% group_by(id, x) %>% mutate(y = paste(y, collapse = " "))
おかげで、非常に便利な答え – Maggie