0
私はパンダで四半期ごとに非常に単純な集計を実行し、好奇心からだけその結果をテストしました。パンダ:グループ間の不一致
dfQtr = df.groupby([pd.TimeGrouper(key= 'Date', freq='Q'),'JourneyType','OriginCode','DestinationCode']).agg(np.sum).reset_index()
print sum(dfQtr.TotalFlights) , sum(df.TotalFlights)
941899 967205
@IanS私の謝罪、ここではかなりビッグデータのサブセットが結果が集約後の&前に異なっており、それはあるかもしれない、なぜ私が疑問に思うことを示して
Date JourneyType OriginCode DestinationCode Total_Flights
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P FLL SDQ 1
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P PAP FLL 1
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P TPA BDL 1
01/08/2015 T_A-M-R-A-S_M_R_M_S D_P HPN MCO 1
01/08/2015 T_A-L-O-C-G_L_P_D_S D_P FLL PAP 1
01/08/2015 T_A-L-O-C-G_L_P_D_S D_P FLL PAP 1
01/08/2015 T_A-L-O-C-G_L_P_D_S D_P FLL PIT 1
を設定しているのですか?
多くの感謝! ウィル
例がないと、それはちょうど推測です... – IanS