ある任意のインスタンスを削除する必要があります。シーケンスの先頭から、私は私が私のデータセットから始めましょう次のインスタンスから30日未満
: 基本的にpatient_id event_description
A DiagnosisA 2016-01-15
A DiagnosisA 2016-02-10
A DiagnosisA 2016-04-20
A DiagnosisA 2016-06-02
B DiagnosisA 2016-08-15
B DiagnosisA 2016-08-20
B DiagnosisA 2016-09-20
B DiagnosisA 2016-10-30
C DiagnosisA 2016-10-15
C DiagnosisA 2016-11-20
C DiagnosisA 2016-11-25
C DiagnosisA 2016-12-30
、私が必要
event_description
の1番目のインスタンスと2番目のインスタンスの差を計算し、その差が30未満か30より大きいかどうかを確認します.30より小さい場合は、そのインスタンスを削除します。- これは、最終的なサンプルデータセットのような希望
各event_description
のためにすべてのインスタンスに対して実行する必要があり、patient_id
ます:
groupby
と
diff
お知らせを使用して
patient_id event_description
A DiagnosisA 2016-01-15
A DiagnosisA 2016-04-20
A DiagnosisA 2016-06-02
B DiagnosisA 2016-08-15
B DiagnosisA 2016-09-20
B DiagnosisA 2016-10-30
C DiagnosisA 2016-10-15
C DiagnosisA 2016-11-20
C DiagnosisA 2016-12-30
あなたがこれまで持っているコードを共有してください。あなたはソリューション全体を求めていますか? – theBrainyGeek