1
今、私はパンダを使ってグルーピングすることについてちょっと混乱します。単一の値ではないチャンクによるパンダグループ
私は3列のデータ(60Kを超える行)の設定されている:
2015/12/18 11:12:49 +0300 d1 b1
2015/12/18 11:12:50 +0300 d2 b2
2015/12/18 11:13:08 +0300 d1 b3
2015/12/18 11:13:36 +0300 d2 b4
2015/12/18 11:13:43 +0300 d2 b5
2015/12/18 11:14:21 +0300 d2 c0
2015/12/18 11:14:42 +0300 d2 c1
2015/12/18 11:15:13 +0300 d1 c2
2015/12/18 11:15:19 +0300 d3 c3
そして、私は(のは、0-4、4-8、8-言わせた期間でグループ化された行数を取得する必要があります12時間など4時間)と平日とその後、1週間以内に1つのセットを取得します。
私は(時間は第一列の名前です)、週に1時間毎の合計を取得することができます。
dind = pd.DatetimeIndex(df.time)
gr = df.groupby([dind.weekday, dind.hour])
gr.size()
しかし、私はどのようにグループの塊で把握して、単一へMultiIndex
を結果としてマージすることはできませんインデックス列。
私はそれが問題の明確な説明であったと思います。
感謝。魅力のように動作します。 – gudvinr
あなたが気にしないなら、私は関連する質問があります。 全体を一括してチャンクする方法は? 'df.groupby([dind.date // N])'のようなものですが、日付オブジェクトは分割できません。 – gudvinr
@ gudvinr 'df.groupby(pd.TimeGrouper( '3D'))' – piRSquared