2016-05-19 19 views
0

私はパンダで四半期ごとに非常に単純な集計を実行し、好奇心からだけその結果をテストしました。パンダ:グループ間の不一致

dfQtr = df.groupby([pd.TimeGrouper(key= 'Date', freq='Q'),'JourneyType','OriginCode','DestinationCode']).agg(np.sum).reset_index() 

    print sum(dfQtr.TotalFlights) , sum(df.TotalFlights)    
         941899    967205 

@IanS私の謝罪、ここではかなりビッグデータのサブセットが結果が集約後の&前に異なっており、それはあるかもしれない、なぜ私が疑問に思うことを示して

Date   JourneyType    OriginCode   DestinationCode Total_Flights 
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P   FLL      SDQ     1 
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P   PAP      FLL     1 
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P   TPA      BDL     1 
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P   HPN      MCO     1 
01/08/2015 T_A-L-O-C-G_L_P_D_S D_P   FLL      PAP     1 
01/08/2015 T_A-L-O-C-G_L_P_D_S D_P   FLL      PAP     1 
01/08/2015 T_A-L-O-C-G_L_P_D_S D_P   FLL      PIT     1 

を設定しているのですか?

多くの感謝! ウィル

+1

例がないと、それはちょうど推測です... – IanS

答えて