私はこのように見えますが、いくつかの百万件のインスタンスがあるデータセット、DF、持っている:はRに複製し、その合計値を削除
Date AD Runway MTOW nr.flights 2008-01-01 A 18 376 2 2008-01-01 A 18 376 2 2008-01-01 D 36 190 1 2008-01-02 D 09 150 2 2008-01-02 A 36 280 1 2008-01-02 A 36 280 1
そして、私はそれが次のようになりたい:
を Date AD Runway MTOW nr.flights 2008-01-01 A 18 752 4 2008-01-01 D 36 190 2 2008-01-02 D 9 150 2 2008-01-02 A 36 560 1
基本的には、同じDate、AD、Runwayの行をまとめてグループ化したいので、すべての複製が削除されます。同時に、MTOWとnr.flightsを特定の日付、AD、滑走路について集計します。 vals <- expand.grid(Date = unique(df$Date), Runway = unique(df$Runway), AD = unique(df$AD))
は、だから私は、元のデータセット、DFでこれをマージすることができ、それはうまくいきませんでした:
私はこれを試してみました。私はgroup_byのいくつかの組み合わせを試してみましたが、それも私に望みの結果を与えてくれませんでした。
は再現するには、次の
df <- data.frame(Date=c("2008-01-01","2008-01-01","2008-01-01","2008-01-02","2008-01-02","2008-01-02"),
AD = c("A", "A", "D", "D", "A", "A"), Runway = c(18, 18, 36, 09, 36,36),
MTOW = c(376, 376, 190, 150, 280, 280), nr.flights = c(2,2,1,2,1,1))
すべてのヘルプははるかに高く評価されるだろう!ライブラリdplyr
で
このソリューションは完璧に動作します!ご助力ありがとうございます! – Veraaa