2012-04-18 15 views
5

私はpandasデータフレームを使ってデータを集計しました。以下は実際のデータとその集計方法です。 パンダはデータを集計した配列に集約しました。データ構造の変換

http://pastebin.com/R8XWpgtU

私は何をしたいことは、この(行=行、列= COL)の2D numpyの配列を作成ある

fdf.groupby(['row',col'])['percent'].sum()。これを行うための滑らかな方法?私は似た何かをした

もう一つの方法は、ピボットテーブルにこの場合

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

を作成した私は、numpyの配列を2dにこのピボットテーブルを変換します。この表の各セルにインデックスを付ける方法はありますか?もしそうなら、私はおそらく表そのものでOKになるでしょう。

答えて

6

試してみてください。代わりに

result = fdf.groupby(['row',col'])['percent'].sum() 
result.unstack('col').values 

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values 
関連する問題