2017-05-23 21 views
-1

「貢献」という列のPandasデータフレームがあります。この列には、合計に対する各行のデータの寄与率(つまり、貢献度の合計= 100%)が含まれます。私は彼らの貢献の観点から行の上位70%を選択できるようにしたいと思います。これどうやってするの?Python - 累積合計に基づいてPandas DataFrameから選択

df.sort_values('contribution', ascending=False) 
+0

'DF1 = df.sort_values( '貢献'、昇順= False)が'; 'df1 [df1.contribution.cumsum()> = 70]'? – Abdou

答えて

0

quantile()で試してみてください:

df[df.contribution > df.contribution.quantile(.3)] 
関連する問題