0
40個の列に100,000行のデータセットがあり、フィルタリング/削減/間引きが必要です。したがって、2014年10月10日前と20.8年後のすべての注文を削除します0.2016(私はテーブルに保存しておきたい時間スパンが1.10.2104-20.8.2016で)どのように私はこれを行うことができます(とちょうどテーブルから不要な古いデータを削除)Here's例:特定の時間間隔を持たない行を削除する
DB <- data.frame(orderID = c(1,2,3,4,5,6,7,8,9,10),
orderDate = c("01.07.2014 05:11","12.08.2014 12:39","09.09.2015 09:14","04.10.2014 16:15","02.11.2015 07:04", "10.11.2015 16:52","20.02.2016 08:08","12.04.2016 14:07","24.07.2016 17:04","09.09.2016 06:04"),
itemID = c(2,3,2,5,12,4,2,3,1,5),
size = c("m", "l", 42, "xxl", "m", 42, 39, "m", "m", 44),
color = c("green", "red", "blue", "yellow", "red", "yellow", "blue", "red", "green", "black"),
manufacturer = c("11", "12", "13", "12", "13", "13", "12", "11", "11", "13")
customerID = c(1, 2, 3, 1, 1, 3, 2, 2, 1, 1)
期待される結果:
DB <- data.frame(orderID = c(3,4,5,6,7,8,9),
orderDate = c("09.09.2015 09:14","04.10.2014 16:15","02.11.2015 07:04", "10.11.2015 16:52","20.02.2016 08:08","12.04.2016 14:07","24.07.2016 17:04"),
itemID = c(2,5,12,4,2,3,1),
size = c(42, "xxl", "m", 42, 39, "m", "m"),
color = c("blue", "yellow", "red", "yellow", "blue", "red", "green"),
manufacturer = c("13", "12", "13", "13", "12", "11", "11")
customerID = c(3, 1, 1, 3, 2, 2, 1)
では、[このポスト](HTTPを見て/stackoverflow.com/questions/23622338/subset-a-dataframe- between-2-dates-in-r-betterway)。また、あなたの日付をフォーマットするために、lubridateと 'dmy_hm'を使うこともできます – etienne