2016-07-08 16 views
0

私はまだPythonとpandasには新しく、まだ学習しようとしています。複雑なシナリオでPandasを使用しようとしています。以下の私のデータフレームの小さなサンプルデータフレームの異なる行番号で異なる列の値を比較する

In [9]: df 
Out[9]: 
     TXN_KEY Send_Agent Pay_Agent  Send_Customer /
0  13272184 AWD120279 AEU002152 1000000000021979638 
1  13272947 ARA030122 AWD120279 1000000000030604143 
2  13273453 API185805 API190139 2000000000096483346 
3  13273870 ANO080012 API352676 1000000000046574257 
4  13274676 AUK359401 API185805 1000000000082052557 
5  13274871 ACL000105 ACB020203 1000000000082187111 


    Pay_Customer   Send_Time   Pay_Time 
0  1000000000081805876 2012-05-22 09:45:00 2012-05-31 02:50:00 
1  1000000000021979638 2012-05-31 08:09:00 2012-05-31 09:52:00 
2  2000000000241863019 2012-05-30 04:18:00 2012-05-30 23:42:00 
3  2000000000080690692 2012-05-31 02:25:00 2012-05-31 21:43:00 
4  2000000000096483346 2012-05-31 11:25:00 2012-05-31 11:57:00 
5  1000000000301277732 2012-05-31 13:07:00 2012-05-31 17:36:00 

Send_CustomerはPay_Customerがお金を受け取っているPay_Agentに送信エージェントを使用してお金を送信しています。

いずれのエージェントも、エージェントを送信するエージェントと有料のエージェントの両方になることができます。

すべての代理店について、お金を送って10時間以内に受け取った顧客をカウントしたいと思います。

たとえば、上記の例の場合: お客様1000000000021979638がAWD120279エージェントを使用して送金しており、10時間以内に同じエージェントAWD120279でお金を受け取っています。

お客様と同じです。2000000000096483346 atエージェントAPI185805。

したがって、AWD120279とAPI185805の両方のカウントは、このシナリオでは1です。

私はこのようなシナリオにどのようにアプローチするかについて私の頭を払うことはできません。前もって感謝します。

答えて

0

送信側とPay側からデータフレームを分割し、内部結合を実行することで、私は望ましい出力を得ることができました。

関連する問題