2
私はpandas groupby documentationを読んでみましたが、私はそれに従うことができません(もっと例が必要です)。私は、次のデータフレームを持っている:パンダの列による集計を作成するにはどうすればよいですか?
df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
'B' : ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
'C' : np.random.randn(8),
'D' : np.random.randn(8)})
私は1つの列、および他の列のC/D
の合計値でCの合計値を持つ2つの列、foo
とbar
を持つ新しいデータフレームを、したいです。このように、例えば:
A C C_over_D
'foo' 1.2 3.4
'bar' 2.3 5.4
私はちょうど約このようなCの合計値を取得することができます:
df = df.groupby('A')['C'].sum()
これはCのためノー列名をバック私にデータオブジェクトを与えるが:
A
bar -0.821788
foo -6.006086
しかし、これをどのように拡張して、(a)Cの列で適切なデータフレームを返すのですか?(b)Cの値をDに戻しますか?