次のデータフレームに欠落行を追加しようとしています。multidplyrを使用して欠落行を追加する
df = data.frame(DATE = as.Date(c("2016-05-31", "2016-08-31", "2016-10-31", "2016-07-31", "2016-08-31", "2016-10-31", "2016-12-31")),
KONTR = c("122","122","122","553","553","102","102"),
KAP = as.double(1:7),
DIV =c("PI","PI","PI","OP","OP","PR","PR"))
このコードは
result = df %>%
group_by(KONTR) %>%
do(left_join(data.frame(KONTR = .$KONTR[1], DATE = seq(min(.$DATE)+1, max(.$DATE)+1, by="1 month")-1), .,
by=c("KONTR", "DATE")))
に動作しますが、私の本当のデータフレームは1.5メートルの列を持っているとして、それが完了するまでに15分以上かかります。私は次のコードでmultidplyrを使用しようとしましたが、エラーが発生し、何が間違っているのか分かりません。
cluster <- create_cluster(3)
by_kontr <- df %>% partition(KONTR,cluster=cluster)
result = by_kontr %>%
group_by(KONTR) %>%
do(left_join(data.frame(KONTR = .$KONTR[1], DATE = seq(min(.$DATE)+1, max(.$DATE)+1, by="1 month")-1), .,
by=c("KONTR", "DATE")))
Error in checkForRemoteErrors(lapply(cl, recvResult)) :
3 nodes produced errors; first error: could not find function "left_join"
を書く
left_join
の ' – akrundplyrが使用されているすべてのパッケージを表示してください – Koles
ロードされている'ライブラリ(dplyr)をロードしてください。どのパッケージに 'partition'などの機能があるのか分かりません – akrun