私はsparklyr
ライブラリを使用しています。計算を行うSpark(R)
私はスパークにコピー変数、wtd
を持っている:
copy_to(sc,wtd)
colnames(wtd) <- c("a","b","c","d","e","f","g")
その後、私は計算を行うと、私がしようとすると、スパークではなく、R.
で私の環境でそれを保存したいです:UseMethodで
sdf_register(wtd %>% group_by(c,b) %>% filter(row_number()==1) %>%count(d), "wtd2")
エラー( "sdf_register"): なし適用可能な方法「sdf_register」の
wtd2 = wtd %>% group_by(c,b) %>% filter(row_number()==1) %>%count(d)
正常に動作「( 『TBL』、 『data.frame』 『tbl_df』)C」
コマンドクラスのオブジェクトに適用されるが、それは、私の環境で保管しないであろう火花の中に。
ありがとうございます!それが助けになった! –
@JaimeCaffarelこれは面白いです、あなたの答えはこの瞬間に私を助けてくれます!! :)私が得ないものは、 'copy_to'と' sdf_register'の実行の違いは何ですか。どちらの場合でもスパークデータフローを作成できますか? –
@Noobieありがとう:-)違いは、 'copy_to'はデータフレームをSparkにコピーするだけですが、' sdf_register'はデータフレームのHiveメタデータを作成するので、Hiveを使ってデータをチェックすることができます(テーブル "wtd2"この場合)。 –