にzscore列Iは、Zスコアことをデータフレームには、このような別の列を列を挿入することができる追加:グループ化することによってパンダのデータフレーム
[1] df.insert(<loc>, column='ZofA', value=(df['A']-df['A'].mean())/df['A'].std())
I 2でグループ化された列の単純化を行うことができるがこのような他の列:
[2] df.groupby(['C1', 'C2'])['A'].mean()
は、私は[1]でzscore機能付[2]における単純平均()関数を置き換えるしようとしましたが、それを行う方法を見つけ出すことができなかった、.applyを含みます - 例えば
私の最初の問題は、明らかにグルーピングでzscore列を作成する方法がわかりません。
2番目の問題は、(1)別の列( 'A')からz-スコアを保持するデータフレーム( 'ZofA')に新しい列を挿入し、それらのzスコアを2つの他の列( 'C1'、C2 ')によって定義されるグループ内で計算されます。そして、(3)これをすべて1つのdf.insert()文の中で実行したいと思います。かっことかっこを何かにぶち込んでしまっているのですか、それとも1つの声明であまりにも多くをやろうとしていますか?ありがとう!
本で読んでください:http://pandas.pydata.org/pandas-docs/stable/groupby.htmlドックに正確な例があります – Boud
答えとして投稿し、それが正しいとマークしてくださいあなたの問題を解決しました。 – ayhan