私は2015年と2016年(135,000)の2年間のユーザーテキストメッセージのデータセットを持っています。 2016年2月にこのプログラムの新規ユーザーを特定しようとしています(subscriber_idとentity == "subscribe-online"に基づいています)。日付に基づいて新しいユーザーIDを特定するR
新しいユーザーは、過去12か月以内にsubscriber_idがデータ内で発生しなかったということです。私はの最後に出現するという事実に基づいて、新しいユーザーとして15855を割り当てることができるようにしたい
created subscriber_id cellnum entity message msgtxt
2015-21-01 14:03:00 15855 7788826943 tip 100 end
2015-07-12 14:03:00 15839 7788815940 tip 24 tip 24
2015-08-12 14:03:00 15839 7788815940 stop 99 stop
2016-01-01 14:05:00 15800 2508816941 tip 25 tip 25
2016-02-01 16:05:00 15800 2508816941 tip 26 tip 26
2016-03-01 14:05:00 15800 2508816941 tip 27 tip 27
2016-01-02 14:03:00 15855 7788826943 subscribe-online 1 msg 1
2016-01-02 14:03:00 15839 7788815940 subscribe-online 1 msg 1
15855と15839の両方2月1日にサブスクライブ:私は、次のサンプルデータを持っているのであれば、例えば、 subscriber_id 15855は2015年1月21日 - 12ヶ月以上経過しています。私は最後の出現が2015年12月8日(12ヶ月未満)だったので、15839をリピートユーザーとして割り当てたいと思います。
作成された(日付)フィールドは、POSIXct形式です。私はループを理解しようとしていました。どんな助けでも大歓迎です。ありがとう。ここで