この問題を詳細に調査したところ、解決策はまだ見つかりません。私は43行と2列の単純なデータフレームを持っています。私の最初の列には2つの日付が含まれます。最初の日付は19回、残りは24回印刷されます。 2番目の列は温度です。私は日付で最大と最小の温度を探したいのですが、私のコードはデータセット全体の最大値と最小値を印刷し続けます。dplyrのgroup_by日付列
データ:
Date <- c(rep(x = "2017-05-18", each= 19), rep(x = "2017-05-19", each= 24))
Temperature_F <- c(35, 35, 42, 49, 57, 63, 64, 67, 70, 71, 72, 71, 72, 70, 66, 61, 57, 54, 50, 49, 45, 44, 44, 42, 40, 39, 47, 53, 61, 67, 69,
72, 75, 76, 77, 76, 77, 75, 71, 66, 62, 58, 54)
NWS_temps1 <- data.frame(Date, Temperature_F)
は、ここで私はそれが私の日付別の最大と最小温度を与えるべきだと思うとき私に全体の温度列の最大と最小を与え続け、私のdplyrコードです。
NWS_temps1 <- tbl_df(NWS_temps1)
NWS_temps1 %>%
group_by(Date) %>%
summarise(Tmax = max(Temperature_F), Tmin= min(Temperature_F))
私が手出力は次のようになります。
Tmax Tmin
77 35
私は期待しています:それが必要として日がグループ化されていない理由
Date Tmax Tmin
2017-05-18 72 35
2017-05-19 77 39
私は理解していません。私はそれがここにある文字、日付オブジェクト、そしてPOSIXctのような因子にDateを変更しようとしましたが、私の結果は常に合計データフレームの最大値と最小値です。
ご迷惑をおかけして申し訳ありません。
ありがとうございました。
使用 'group_by'、ない' group_by_'、から
tapply
を使用してソリューションです。 – wwwgroup_byを試してみると、それは私のところではエラーでした。 group_byとgroup_by_の両方で同じ結果が生成されます。/ – user3720887
あなたのコードをテストし、 'group_by_'を' group_by'に置き換えました。出来た。 – www