.describe()
関数を再フォーマットして出力しようとしています。パンダのpython .describe()の書式設定/出力
from pandas import *
data = read_csv('testProp.csv')
temp = data.groupby('name')['prop'].describe()
temp.to_csv('out.csv')
出力は次のとおりです:しかし
name
A count 3.000000
mean 2.000000
std 1.000000
min 1.000000
25% 1.500000
50% 2.000000
75% 2.500000
max 3.000000
B count 3.000000
mean 3.666667
std 1.527525
min 2.000000
25% 3.000000
50% 4.000000
75% 4.500000
max 5.000000
dtype: float64
、私は形式のデータが欲しい、私は次のように入力するとここ は、CSVデータ(testProp.csv
)
'name','prop'
A,1
A,2
B, 4
A, 3
B, 5
B, 2
です以下。私はtranspose()
しようとしているとdescribe()
を使用して維持し、その代わりにa .agg([np.mean(), np.max(), etc....)
を操作したいと思います:最初、.reset_index()
を行うには、あなたのtemp
データフレームのためのインデックスをリセットすることですこれを行うには
count mean std min 25% 50% 75% max
A 3 2 1 1 1.5 2 2.5 3
B 3 3.666666667 1.527525232 2 3 4 4.5 5
のドキュメントpandas unstackは動作しませんチェックしてください。 "KeyError:0"を返します。 – Shehryar