2
タイムスタンプの付いたデータには、「ラベル」とカウントが2つあります。私は、1日あたりのラベルごとの合計で時系列を作成したいと思います。これを達成するためにresample
を使用できますか?パンダでデータフレームを再サンプリングする
具体例:この例で
import pandas as pd
import numpy as np
from itertools import cycle
idx = pd.date_range('2016-01-01', '2016-01-07', freq='H')
n = np.random.randint(10, size=24*6+1)
lst = [(l,c) for l,c in zip(cycle(['foo', 'bar']), n)]
df = pd.DataFrame(lst, index=idx, columns=['label', 'n'])
df.resample(???).sum()
、ターゲット・データ・フレーム間隔当たりの総カウント数を含む時間インデックス2列(foo
とbar
)を含むべきです。
を私がしました可能ではありません非常に強力な 'groupby'で' resample'を連鎖させることができます。補足として、私はTimeGrouperを使って第3の方法を見つけました: 'df.groupby([pd.TimeGrouper( 'W')、 'label'])' '。 –