0
#First, I divide the age group as follow ,
# 1. group A: 0-17years old;
# 2. group B: 18-35years old
# 3. group C: 36-50years old
# 4. group D: 51-65years old
# 5. group E: above 66 years old
#Then I begin to write code extact the CVC data
Passenger_Age={"PassengerId":titanic["PassengerId"][:],"Age":titanic["Age"][:]}
Passenger_Age_df = pd.DataFrame(Passenger_Age,columns =["Age","PassengerId"])
Passenger_Survived={"PassengerId":titanic["PassengerId"[:],"Survived":titanic["Survived"][:]}
Passenger_Survived_df = pd.DataFrame(Passenger_Survived,columns = ["Survived","PassengerId"])
# consider there are some NAN in Age, so wirte the blow cod to drop the Age data
cleaned_Passenger_Age_df = Passenger_Age_df.dropna()
次のステップについては、「cleaned_Passenger_Age_df」と「Passenger_Survived_df」の2つのデータフレームをマージしたいと思います。その後
は、
私の問題は、SMY考えである年齢層の生き残り率を見つけるために、それに応じて次にABCDE
に年齢を変換するapplymap機能を使用することは明らかであるが、私はコードを書くか分からない、誰かが助けることができます私? THX!あなたは、たとえば、グループに年齢をpd.cut()
を使用することができます年齢グループと生存率の相関を分析する