.dt.days
が.dt.total_seconds()
より100倍長くなるのはなぜですか?timedeltaメソッドのパフォーマンスが遅い
df = pd.DataFrame({'a': pd.date_range('2011-01-01 00:00:00', periods=1000000, freq='1H')})
df.a = df.a - pd.to_datetime('2011-01-01 00:00:00')
df.a.dt.days # 12 sec
df.a.dt.total_seconds() # 0.14 sec
より速い選択肢は 'days = pd.Series(df ['a'] .dt.values.astype( 'timedelta64 [D]'))' – unutbu