毎日date
私はブランドのすべての組み合わせから金額の平均を取得したいと思います。パンダはパワーセットと平均データを作成します
例えば、私はデータフレームがあります、現在
result =
Company Brand Date Amount
A 1 01/01/2015 3
A 1 01/02/2015 4
A 1 01/03/2015 2
A 2 01/01/2015 7
A 2 01/02/2015 2
A 2 01/03/2015 1
A 3 01/01/2015 6
A 3 01/02/2015 3
A 3 01/03/2015 1
A 1_2 01/01/2015 5
A 1_2 01/02/2015 3
A 1_2 01/03/2015 1.5
A 2_3 01/01/2015 6.5
A 2_3 01/02/2015 2.5
A 2_3 01/03/2015 1
A 1_3 01/01/2015 4.5
A 1_3 01/02/2015 3.5
A 1_3 01/03/2015 1.5
A 1_2_3 01/01/2015 5.33
A 1_2_3 01/02/2015 3
A 1_2_3 01/03/2015 1.33
:
df1 =
Company Brand Date Amount
A 1 01/01/2015 3
A 1 01/02/2015 4
A 1 01/03/2015 2
A 2 01/01/2015 7
A 2 01/02/2015 2
A 2 01/03/2015 1
A 3 01/01/2015 6
A 3 01/02/2015 3
A 3 01/03/2015 1
を、私は結果が金額が結合基の平均である以下のDFになりたいですこれを行うにはグループバイでループを使用していますが、非常に遅いです。
d = pd.DataFrame()
comb = ['1_2','1_3','2_3','1_2_3']
for c in comb:
new = df1.loc[(df1.Brand.isin(map(int,c.split('_')))].groupby(['Company','Date'])['Amount'].mean().reset_index()
new.insert(1,'Group',c)
d = d.append(new)
df = df.append(d)
しかし、私は数千のユニークな企業と数百万行で作業しているため、これは非常に遅いです。これをスピードアップする方法はありますか?