2016-12-08 18 views
0

私はいくつかのデータからクロス集計を作成し、結果を操作/グラフ化するという単純な作業をしようとしています。Pythonでクロス集計データフレームを使用しグラフ化する

次のコードを取る:問題は、私はそのデータフレームを必要とするということである

enter image description here

import pandas as pd 
import numpy as np 
df=pd.read_csv("https://raw.githubusercontent.com/wesm/pydata- book/master/ch08/tips.csv", sep=',') 
df_out=df.pivot_table(index=["day"],values=["tip"], columns=["sex"],aggfunc=[np.sum]) 

日で私にヒントのピボットテーブルを与え、次のようになります。次のようになります。

enter image description here

だから私はと対話することができますされており、グラフ、それは

例えば、私は

df[female]-df['male'] 

をしたいと私はどのように日によって

を男性と女性のseaborn率プロットをグラフにしたいです私はここで余計なデータを取り除くのですか?私はなど、インデックスをリセットし、列をドロップしようとしたが、あなたの助けのための

おかげでそれを把握するように見えることはできません - この一日中

答えて

1

で戦って、私は他の集計関数でこれに実行して覚えていると思います。次の作業はできますか?

new_df = df['sum']['tip'] 
new_df['delta'] = new_df['female'] - new_df['male'] 
1

代替方法:

df_out = df_out['sum']['tip'] 
del df_out.columns.name 
del df_out.index.name 
関連する問題