月単位でインデックスされたデータフレームを想定して、1日ごとに再インデックスする(アップサンプル)。以前に月ごとに索引付けされた値は、今月の日数で除算されます。索引に加えて、列をグループ化で使用する必要があります。 thisに似ています - グループ化でも列が使用されているだけです。 インデックス+カラムを持つパンダのアップサンプリングデータフレーム
import pandas as pd
import numpy as np
np.random.seed(1234)
tidx_m = pd.date_range('2011-01-31', periods=5, freq='M')
df = pd.DataFrame(np.random.randint(0, 2, (5, 2)), columns=['class', 'val'])
df.index = tidx_m
df = pd.concat([df, df])
df.ix[:5, 'class'] = 0
df.ix[5:, 'class'] = 1
print(df)
class val
2011-01-31 0 1
2011-02-28 0 1
2011-03-31 0 0
2011-04-30 0 1
2011-05-31 0 1
2011-01-31 1 1
2011-02-28 1 1
2011-03-31 1 0
2011-04-30 1 1
2011-05-31 1 1
代わりヶ月の日にインデックスをアップサンプリングした後、私は、日時、インデックス
と
class
でグループにしたいと思います。 「val」の値は、その月のすべての日に再配分する必要があります(1は1月の1日あたり1/31になります)。
あなたはサンプルデータと所望の出力を追加することはできますか? – jezrael
実際のデータはインデックスに重複していますか? 'df = pd.concat([df、df])'は省略可能ですか? – jezrael
サンプルありがとうございます。 – jezrael