2016-11-12 9 views
0

私はKaggleのタイタニックデータの年齢分布のプロットをプロットしようとしています。私はこのコードを試してみましたなど年齢0-10、10-20のためのようデータセットからのプロットの割合

age_distribution_died= df.Age[df['Survived']==0].dropna().value_counts().sort_index() 
age_distribution_survived=df.Age[df['Survived']==1].dropna().value_counts().sort_index() 

私は何をしたいのは、しかし、それは動作しませんでした、サイズ10のビンにグループ化することです。

bins = [0,10,20,30,40,50,60,70,80] 
test = age_distribution.groupby(pd.cut(age_distribution,bins)) 
+1

はあなたが私達にあなたのコードを実行してからの出力/トレースバックを表示することができますか?それは私たちの助けをより簡単にします。 –

答えて

1

あなたはこのようにそれを行うことができます。

import matplotlib 
matplotlib.style.use('ggplot') 

df = pd.read_csv(r'D:\download\train.csv') 

clean = df.dropna(subset=['Age']) 

(clean.groupby(pd.cut(clean.Age, np.arange(0, 90, step=10))) 
     .Survived.mean().mul(100) 
     .to_frame('Survival rate') 
     .plot.bar(rot=0, width=0.85, alpha=0.5, figsize=(14,10))) 

enter image description here

+0

@AlenPavlović、よろしいですか?あなたの質問に答えたと思うなら、[accepting](http://meta.stackexchange.com/a/5235)と答えてください。 – MaxU

関連する問題