私はこのようなデータテーブルmyTable
(入力)があります。集約(R言語)
user_id timestamp event_id
1 Ann 11115555 Level1Start
2 Serg 11113333 Level1Start
3 Ann 11117777 Level1Complete
4 Ann 11116666 Level1Complete
5 Ann 11112222 Level1Start
を私はtimeInLevel
という名前の列を追加し、最初の2つのログLevel1StartとLevel1Complete間の時間を計算する必要があります。
出力:助けを
user_id timestamp event_id TimeInLevel
1 Ann 11115555 Level1Start 4444
2 Serg 11113333 Level1Start NA
3 Ann 11117777 Level1Complete 4444
4 Ann 11116666 Level1Complete 4444
5 Ann 11112222 Level1Start 4444
THX !!!
'4444'から来ませんの? – mtoto
@mtotoログ間のタイムスタンプの差は№5№4です(11116666 - 11112222)。タイムスタンプが最小であるため、最初です。 SergにLevel1Completeのログがありません – Smasell