2017-01-16 10 views
0

パンダにまだかなり新しいイム... は、私は次のGROUPBY句でシリーズを受信するために管理:Pandas groupby.value_counts()を実行した後、どのように結果をフィルタリングできますか?

data.groupby("salary_percentile").early_quitter.value_counts(normalize = True) 
Out: 
    salary_percentile early_quitter 
[17000, 25000]  0    0.744526 
        1    0.255474 
(25000, 30000]  0    0.751880 
        1    0.248120 
(30000, 38000]  0    0.701799 
        1    0.298201 
(38000, 46000]  0    0.772118 
        1    0.227882 
(46000, 53000]  0    0.742015 
        1    0.257985 
(53000, 57000]  0    0.720339 
        1    0.279661 
(57000, 61000]  0    0.745763 
        1    0.254237 
(61000, 64000]  0    0.688144 
        1    0.311856 

早く簡単にあきらめる人の列がある場合、私は(salary_percentileおよびパーセントのそれぞれの第2の値をのみ必要です1) - 私はこれをどのように適切に行うのですか?

答えて

1

最も単純でxsです:

df = df.xs(1, level=1) 
print (df) 

salary_percentile 
[17000, 25000] 0.255474 
(25000,30000]  0.248120 
(30000,38000]  0.298201 
Name: val, dtype: float64 
+0

そして、私は今、pairplotしたい場合 - x軸とy軸上の割合で給与のバケットを持つ - 私はにシリーズを変換する必要がありますデータフレーム?またはインデックスvs varをプロットすることはできますか? – sputniza

+0

私はいいえ、あなたは 'df.xs(1、level = 1).plot()'だけ必要と思います。 – jezrael

関連する問題