0
最初のデータフレームの各行について2つのデータフレームが与えられた場合、同じproduct_id
を持つ行が見つかるが、visiting_time
の行がより大きく、 2つの行は最小です。 cart_add_dataの2番目の行がpurchase_data
の最初の行と一致するR:2つのデータフレームから最小の時間間隔で一致する行
例えば
。
ところで、計算効率も重要です。
データフレーム:cart_add_data
visting_time product_id
1 2012-01-08 13:29:39 878435
2 2012-01-08 13:36:52 122100
3 2012-01-08 13:38:47 150473
4 2012-01-14 21:06:36 169403
5 2012-01-14 21:06:36 137092
データフレーム:purchase_data
visting_time product_id
1 2012-01-08 13:42:35 122100
2 2012-01-08 13:42:35 138857
3 2012-01-08 13:42:35 150473
4 2012-01-18 22:15:04 140376
5 2012-02-02 09:21:28 130437
しきい値とは何ですか? – akrun
しきい値がない場合、一致する行が複数ある場合は、最小の時間間隔で行を保持します。一致する行が1つしかない場合は、それを保管してください。 – user3237142