user_id
、time_stamp1
、time_stamp2
、およびinterval
の4つの列を持つパンダのデータフレームで作業しています。 Time_stamp1とtime_stamp2はdatetime64 [ns]タイプであり、intervalはtimedelta64 [ns]タイプです。pandasデータフレーム内のグループ内にTimedeltaデータを追加
私はデータフレーム内の各user_idをする間隔の値を合計したいと、私のように多くの方法でそれを計算してみました:
1)df["duration"]= df.groupby('user_id')['interval'].apply (lambda x: x.sum())
2)df ["duration"]= df.groupby('user_id').aggregate (np.sum)
3)df ["duration"]= df.groupby('user_id').agg (np.sum)
が、それらのどれも動作していないとduration
の値は後NaT
になりますコードを実行します。
何'df.groupbyについて['interval']。agg( 'sum') '?['interval']。 – MaxU
私もこれらの2つを確認しましたが、 '' duration''カラムの結果は '' Nat'' – user3854325
です。サンプルデータセットを投稿できますか? – MaxU