mayデータフレーム内のすべての変数の最初と最後の欠落した観測値をいつ調べるかを知りたい。 df_stats
返し変数の最初と最後の不足観測を報告する
library(tidyverse)
df <- tribble(
~year, ~country, ~series1, ~series2,
#--|--|--|----
2003, "USA", NA, 5,
2004, "USA", NA, 6,
2005, "USA", NA, 7,
2006, "USA", 10, 8,
2007, "USA", NA, 4,
2008, "USA", NA, 10,
2009, "USA", 16, 12,
2010, "USA", 12, 8,
2011, "USA", 12, 13,
2012, "USA", 13, 10,
2013, "USA", 11, 5,
2005, "FRA", 5, NA,
2006, "FRA", 6, NA,
2007, "FRA", 5, NA,
2008, "FRA", 4, NA,
2009, "FRA", 9, NA,
2010, "FRA", 7, NA,
2011, "FRA", 14, NA,
2012, "FRA", 7, 11,
2013, "FRA", 6, 6,
2014, "FRA", 5, 7,
2015, "FRA", 4, 5
)
df_stats <- df %>%
group_by(country) %>%
summarize(First = min(year, na.rm = TRUE),
Last = max(year, na.rm = TRUE))
:
--------------------------
| country | First | Last |
--------------------------
| FRA | 2005 | 2015 |
--------------------------
| USA | 2003 | 2013 |
--------------------------
しかし、私はseries1
とseries2
私のために別々にこれを持ってしたいと思います。
は(私の実生活の問題で、私は多くの国や多くの変数を持っています。)
だから私は取得したいと思います:
-------------------------------------------------------------------------
| country | First.series1 | Last.series1 | First.series2 | Last.series2 |
-------------------------------------------------------------------------
| FRA | 2005 | 2015 | 2012 | 2015 |
-------------------------------------------------------------------------
| USA | 2006 | 2013 | 2003 | 2013 |
-------------------------------------------------------------------------
@docendo discimusソリューションはより簡潔ですが、このソリューションは私が望むものに近いものです。 (シリーズが利用可能な場合、迅速な眼球運動が可能です)。しかし、バグがあります:フリップアップ最大と最小! –
@ ulima2_ yikes、最小/最大のものをソートしました、ありがとう – User632716