2017-02-05 13 views
1

これはdfです。ここで、直前と直後の行の観測値が観測値と同じ値NAと同じです)。 私は周りには成功しませんでした。観測された行に基づいて前後の行(日付)に値を追加するR

ここにサンプルdfがあります。dffilledは私が作ってみたいものです。

dput(df) 
structure(list(Date = structure(c(1L, 12L, 23L, 26L, 27L, 28L, 
29L, 30L, 31L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 13L, 
14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L, 24L, 25L, 32L, 43L, 
54L, 55L, 56L, 57L, 58L, 59L, 60L, 33L, 34L, 35L, 36L, 37L, 38L, 
39L, 40L, 41L, 42L, 44L, 45L, 46L, 47L, 48L, 49L, 50L, 51L, 52L, 
53L), .Label = c("5/1/2012", "5/10/2012", "5/11/2012", "5/12/2012", 
"5/13/2012", "5/14/2012", "5/15/2012", "5/16/2012", "5/17/2012", 
"5/18/2012", "5/19/2012", "5/2/2012", "5/20/2012", "5/21/2012", 
"5/22/2012", "5/23/2012", "5/24/2012", "5/25/2012", "5/26/2012", 
"5/27/2012", "5/28/2012", "5/29/2012", "5/3/2012", "5/30/2012", 
"5/31/2012", "5/4/2012", "5/5/2012", "5/6/2012", "5/7/2012", 
"5/8/2012", "5/9/2012", "6/1/2012", "6/10/2012", "6/11/2012", 
"6/12/2012", "6/13/2012", "6/14/2012", "6/15/2012", "6/16/2012", 
"6/17/2012", "6/18/2012", "6/19/2012", "6/2/2012", "6/20/2012", 
"6/21/2012", "6/22/2012", "6/23/2012", "6/24/2012", "6/25/2012", 
"6/26/2012", "6/27/2012", "6/28/2012", "6/29/2012", "6/3/2012", 
"6/4/2012", "6/5/2012", "6/6/2012", "6/7/2012", "6/8/2012", "6/9/2012" 
), class = "factor"), Obs = c(NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 320L, NA, NA, 
NA, NA, NA, NA, NA, NA, 321L, 321L, 322L, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, 323L, NA, NA, NA, NA, 324L, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, NA, 325L, NA)), .Names = c("Date", "Obs"), class = "data.frame", row.names = c(NA, 
-60L)) 

私は、観測日付直後の前回とすぐには観測値で埋めされる場所以下dffilledとして、最終的なデータフレームをしたいです。

dput(dffilled) 
structure(list(Date = structure(c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 
8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L, 
21L, 22L, 23L, 34L, 36L, 37L, 38L, 39L, 40L, 41L, 42L, 24L, 25L, 
26L, 27L, 28L, 29L, 30L, 31L, 32L, 33L, 35L), .Label = c("5/10/2012", 
"5/11/2012", "5/12/2012", "5/13/2012", "5/14/2012", "5/15/2012", 
"5/16/2012", "5/17/2012", "5/18/2012", "5/19/2012", "5/20/2012", 
"5/21/2012", "5/22/2012", "5/23/2012", "5/24/2012", "5/25/2012", 
"5/26/2012", "5/27/2012", "5/28/2012", "5/29/2012", "5/30/2012", 
"5/31/2012", "6/1/2012", "6/10/2012", "6/11/2012", "6/12/2012", 
"6/13/2012", "6/14/2012", "6/15/2012", "6/16/2012", "6/17/2012", 
"6/18/2012", "6/19/2012", "6/2/2012", "6/20/2012", "6/3/2012", 
"6/4/2012", "6/5/2012", "6/6/2012", "6/7/2012", "6/8/2012", "6/9/2012" 
), class = "factor"), Obs = c(NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA, 320L, NA, NA, NA, NA, NA, NA, NA, NA, 321L, 321L, 
322L, NA, NA, NA, NA, NA, NA, NA, NA, NA, 323L, NA, NA, NA, NA, 
324L, NA, NA, NA, NA), Obs_filled = c(NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, 320L, 320L, 320L, NA, NA, NA, NA, NA, NA, 321L, 
321L, 321L, 322L, 322L, NA, NA, NA, NA, NA, NA, NA, 323L, 323L, 
323L, NA, NA, 324L, 324L, 324L, NA, NA, NA)), .Names = c("Date", 
"Obs", "Obs_filled"), class = "data.frame", row.names = c(NA, 
-42L)) 

ご協力いただければ幸いです。

+0

連続する行に値が入力されたらどうなるでしょうか?前の行と次の行をどのように埋めるのですか?あなたのデータから私は理解できませんでした! –

+0

@ joel.wilson連続した行の値に観測値を使用するが、上記の空白(または前の)値(dffilledの行20〜24など)を上記のように記入していただきありがとうございます。 – Cirrus

+0

関連:[ギャップがmaxgapであってもmaxgapまでのna.locfの充填数]、[グループ数](http://stackoverflow.com/questions/38822441/na-locf-fill-nas-up-to-maxgap-even- if-gap-maxgap-with-groups)を使用します。 – Henrik

答えて

2

1つのアイデアはdplyrです。我々はObsの1位の遅れであるObs1という2つの新しい列を作成し、Obsの1位のリードであるObs2を作成します。次に、​​3210を使用して、3つのObs列を一緒に「マージ」します。最後に不要な列を削除します。

library(dplyr) 
df %>% 
mutate(Obs1 = lag(Obs), Obs2 = lead(Obs), Obs = coalesce(Obs, Obs1, Obs2)) %>% 
select(-c(Obs1, Obs2)) 

#... 
#18 5/18/2012 NA 
#19 5/19/2012 NA 
#20 5/20/2012 320 
#21 5/21/2012 320 
#22 5/22/2012 320 
#23 5/23/2012 NA 
#24 5/24/2012 NA 
#25 5/25/2012 NA 
#26 5/26/2012 NA 
#27 5/27/2012 NA 
#28 5/28/2012 NA 
#29 5/29/2012 321 
#30 5/30/2012 321 
#31 5/31/2012 321 
#32 6/1/2012 322 
#33 6/2/2012 322 
#34 6/3/2012 NA 
#35 6/4/2012 NA 
#... 
関連する問題