2016-10-09 15 views
0

私はこのようなデータフレームを持っています。Pythonでグループの値をプロットする

 country age new_user 
298408  UK 32   1 
193010  US 37   0 
164494  UK 17   0 
28149  US 34   0 
297080 China 29   1  

私はPythonで、単一のグラフにそれぞれの国のための年齢層のためのNEW_USERSのカウント(20-30、30-40など)をプロットしたいです。

基本的には、すべての国のすべての年齢グループに対してnew_user(値0)をプロットし、すべての国のすべての年齢グループに対してnew_user(値1)をプロットする必要があります。

私は20-30,30-40などに年齢をグループ化することは難しいと思っています。 誰かが私がseabornまたはggplotまたはmatplotlibを使ってこれをプロットするのを助けてもらえますか? ggplotは好ましいです!

ありがとうございます。

+0

あなたはつもり '実際の値とのデータセットを得るためにそれらをgroupby'する必要があります。それを持っていますか? –

+0

明白なビンサイズのヒストグラム – cphlewis

答えて

1
import seaborn as sns 
from pandas import DataFrame 
from matplotlib.pyplot import show, legend 
d = {"country": ['UK','US','US','UK','PRC'], 
     "age": [32, 37, 17, 34, 29], 
     "new_user": [1, 0, 0, 0,1]} 

df = DataFrame(d) 
bins = range(0, 100, 10) 
ax = sns.distplot(df.age[df.new_user==1], 
       color='red', kde=False, bins=bins, label='New') 
sns.distplot(df.age[df.new_user==0], 
     ax=ax, # Overplots on first plot 
     color='blue', kde=False, bins=bins, label='Existing') 
legend() 
show() 

enter image description here

関連する問題