2016-04-15 8 views
0

私はKaggleのPython for Titanic災害競争を使用しています。データセット(df)には、「Gender」(1/0)、「Age」、「Pclass」(1/2/3)の3つの属性が含まれています。各Gender-Pclassの組み合わせに対応する年齢の中央値を取得したい。年齢の中央値は、私は次のようにデータフレームを作成しようとした後にPython 3.x - pandasデータフレームをマージする

計算されます

Gender Class 
1  1 
0  2 
1  3 
0  1 
1  2 
0  3 

- -

unique_gender = pd.DataFrame(df.Gender.unique()) 
unique_class = pd.DataFrame(df.Class.unique()) 

reqd_df = pd.merge(unique_gender, unique_class, how = 'outer') 

しかし、出力として

最終的な結果は、データフレームでなければなりません得られたものは -

0 
0 3 
1 1 
2 2 
3 0 

誰かが私に望ましい出力を得るのを助けてくれますか?

+0

をしたい。中央値()' – JohnE

答えて

0

あなたは `df.groupby([ '性別'、 'クラス'])[ '年齢']のようなものをしたい(ヨーネあたり)df.groupby(['gender','class'])['age'].median()

関連する問題