2017-10-21 8 views
0
#First, I divide the age group as follow , 
# 1. group A: 0-17years old; 
# 2. group B: 18-35years old 
# 3. group C: 36-50years old 
# 4. group D: 51-65years old 
# 5. group E: above 66 years old 


#Then I begin to write code extact the CVC data 

Passenger_Age={"PassengerId":titanic["PassengerId"][:],"Age":titanic["Age"][:]} 

Passenger_Age_df = pd.DataFrame(Passenger_Age,columns =["Age","PassengerId"]) 

Passenger_Survived={"PassengerId":titanic["PassengerId"[:],"Survived":titanic["Survived"][:]} 

Passenger_Survived_df = pd.DataFrame(Passenger_Survived,columns = ["Survived","PassengerId"]) 

# consider there are some NAN in Age, so wirte the blow cod to drop the Age data 

cleaned_Passenger_Age_df = Passenger_Age_df.dropna() 

次のステップについては、「cleaned_Passenger_Age_df」と「Passenger_Survived_df」の2つのデータフレームをマージしたいと思います。その後
は、
私の問題は、SMY考えである年齢層の生き残り率を見つけるために、それに応じて次にABCDE
に年齢を変換するapplymap機能を使用することは明らかであるが、私はコードを書くか分からない、誰かが助けることができます私? THX!あなたは、たとえば、グループに年齢をpd.cut()を使用することができます年齢グループと生存率の相関を分析する

答えて

0

group_names = ['A','B','C','D','E'] 
bins = [0,17,35,50,65,1000] 
df['Age_Group'] = pd.cut(df['Age'], bins=bins, labels=group_names) 

もっと詳しく:

pandas.cut

を生き延び率を計算すると、あなただけのように、によってグループを使用することができます

df.groupby(['Age_Group','Survived']).count()/total_numbers 
関連する問題