2017-12-21 8 views
3

tl; dr
複数の列で複数の分割を行う「パーティション」を作成するにはどうすればよいですか?multidplyrを使用するときに複数の列で分割する方法

動機:
私がまとめ勤勉なため、1〜32のコアを使用して不満だった ので、私は、私は複数の列上で動作していますmulti-dplyerを使用しようとしています。

例:
単一の列によってグループ化ビネットショーが、私は私の他のグループ化列が考慮されていない、それを行います。

コード:

library(dplyr) 
library(multidplyr) 
library(nycflights13) 

flights1 <- partition(flights, flight) 
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE)) 
flights3 <- collect(flights2) 

それでは、どのように年、月、日に分割するでしょうか?

これは私のために動作しません:

flights1 <- partition(flights, list(year, month, day)) 
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE)) 
flights3 <- collect(flights2) 

私はこの仕事をするように見えることはできません。これを行うには、適切な、あるいは少なくとも効果的な方法を指摘できますか?

+1

git-hubで問題を開くべきだと思います。 – Masoud

+2

'パーティション(フライト、年、月、日)はあなたのために働いていますか? –

+0

それは...私のコラムが「収集」していることを処理し続ける処理を待っています。 – EngrStudent

答えて

1

?partitionによれば、partitionの使用は

...はによって分割する変数である

partition(.data, ..., cluster = get_default_cluster())

あります。変数のリストを渡す代わりに、各変数を別々に渡します。つまり、

partition(flights, year, month, day)