2017-03-21 12 views
-3

私はpython pandasプログラミングの新人で、クロス集計の詳細を探そうとしています。私は複数の変数に対して1つの定数変数を持つクロステーブルを生成する必要があるという要件があります。すなわち、複数の変数および1つ上の変数としての側面。Pythonのデータフレームとのクロス集計

私は自分の要件をウェブで検索しましたが、2つまたは3つの変数の中からのみクロス集計を見つけることができました。

私の要件に来て、私は今、私はこのデータフレーム内の変数の一つでdataframe(DF)を集計横断したいdataframe

`df = pd.read_csv('C:\Users\Desktop\data.csv')` 

として読んでいdata.csvファイル内のデータセットを持っています。 Cross table Image

同様

... pd.crosstab(df, df.age, margins=True)

の例では、だから、誰もがこの問題の解決に役立つ可能性があります。フィードバックに感謝します。

+2

のStackOverflowへようこそ。この記事を読むには、[素晴らしいパンダの例を提供する方法](http://stackoverflow.com/questions/20109391/how-to-make-good-reproducible-pandas-examples)と[最小で完全で検証可能な例](http://stackoverflow.com/help/mcve)を提供し、それに応じて質問を修正してください。良い質問をする方法(http://stackoverflow.com/help/how-to-ask)も役立つかもしれません。 – jezrael

答えて

0

あなたはpd.pivot_table()を知っていますか?

In [139]: df 
Out[139]: 
     a b c d 
0 5.1 3.5 1.4 0.2 
1 4.9 3.0 1.4 0.2 
2 4.7 3.2 1.3 0.2 
3 4.6 3.1 1.5 0.2 
4 5.0 3.6 1.4 0.2 

その後、

In [138]: pd.pivot_table(df, index=['a','b','c']) 
Out[138]: 
       d 
a b c  
4.3 3.0 1.1 0.1 
4.4 2.9 1.4 0.2 
    3.0 1.3 0.2 
    3.2 1.3 0.2 
4.5 2.3 1.3 0.3 
4.6 3.1 1.5 0.2 
    3.2 1.4 0.2 
    3.4 1.4 0.3 
+0

元の投稿にサンプルレポートを添付して、テーブルの表示方法を示しました。ここで、変数YEARは、データフレームのすべての変数に対して一定であり、サイド変数、すなわち、VAR1、VAR2、およびVAR3は、変数YEARによってクロス集計される。 –

関連する問題