私はまだPythonとpandasには新しく、まだ学習しようとしています。複雑なシナリオでPandasを使用しようとしています。以下の私のデータフレームの小さなサンプルデータフレームの異なる行番号で異なる列の値を比較する
In [9]: df
Out[9]:
TXN_KEY Send_Agent Pay_Agent Send_Customer /
0 13272184 AWD120279 AEU002152 1000000000021979638
1 13272947 ARA030122 AWD120279 1000000000030604143
2 13273453 API185805 API190139 2000000000096483346
3 13273870 ANO080012 API352676 1000000000046574257
4 13274676 AUK359401 API185805 1000000000082052557
5 13274871 ACL000105 ACB020203 1000000000082187111
Pay_Customer Send_Time Pay_Time
0 1000000000081805876 2012-05-22 09:45:00 2012-05-31 02:50:00
1 1000000000021979638 2012-05-31 08:09:00 2012-05-31 09:52:00
2 2000000000241863019 2012-05-30 04:18:00 2012-05-30 23:42:00
3 2000000000080690692 2012-05-31 02:25:00 2012-05-31 21:43:00
4 2000000000096483346 2012-05-31 11:25:00 2012-05-31 11:57:00
5 1000000000301277732 2012-05-31 13:07:00 2012-05-31 17:36:00
Send_CustomerはPay_Customerがお金を受け取っているPay_Agentに送信エージェントを使用してお金を送信しています。
いずれのエージェントも、エージェントを送信するエージェントと有料のエージェントの両方になることができます。
すべての代理店について、お金を送って10時間以内に受け取った顧客をカウントしたいと思います。
たとえば、上記の例の場合: お客様1000000000021979638がAWD120279エージェントを使用して送金しており、10時間以内に同じエージェントAWD120279でお金を受け取っています。
お客様と同じです。2000000000096483346 atエージェントAPI185805。
したがって、AWD120279とAPI185805の両方のカウントは、このシナリオでは1です。
私はこのようなシナリオにどのようにアプローチするかについて私の頭を払うことはできません。前もって感謝します。