2017-09-27 10 views
2

私は以下のデータセットを持っています。与えられた値に基づいて列のパーセンテージを得る方法

train_df.loc[train_df['Survived'] == 1].shape[0]/train_df.shape[0]

が、私はよりよい解決策を探しています:私は、このコマンドで値を取得することができます知っている1.

 Survived            Name 
0   0       Braund, Mr. Owen Harris 
1   1 Cumings, Mrs. John Bradley (Florence Briggs Th... 
2   1        Heikkinen, Miss. Laina 
3   1  Futrelle, Mrs. Jacques Heath (Lily May Peel) 
4   0       Allen, Mr. William Henry 
5   0         Moran, Mr. James 
6   0       McCarthy, Mr. Timothy J 
7   0      Palsson, Master. Gosta Leonard 
8   1 Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg) 
9   1    Nasser, Mrs. Nicholas (Adele Achem) 

に等しい値生き残っの割合を取得したいです。これを行うための簡単な方法はありますか?私は複数の値をサポートしたい場合は

答えて

3

使用pd.Series.mean

df.Survived.mean() 

0.5 
+4

ああ、数学の不思議... – blacksite

+0

、私はそれをどのように行うことができますか?たとえば、「存続」には3つの値0,1,2があります。これら3つの値のうち、どのようにして1を計算できますか? –

+0

あなたは明確ではありません。 「1」であるすべての値のうちの「1」の平均は「1」である。すべての値の中で '1 'の頻度を望むなら、' df.Survived.eq(1).mean() 'を使います。一度にすべてを望むなら 'df.Survived.value_counts(normalize = True)'を使います。 – piRSquared

関連する問題