2016-04-12 12 views
5

私は、次のデータフレームがあります。今、私はいくつかの分位数を計算したい無限を含むシリーズのパンダ分数?

calc_value 
0   NaN 
1 0.000000 
2 0.100000 
3 0.500000 
4 2.333333 
5   inf 

を:

print df.quantile(.1)['calc_value'] 
print df.quantile(.25)['calc_value'] 
print df.quantile(.5)['calc_value'] 
print df.quantile(.75)['calc_value'] 
print df.quantile(.9)['calc_value'] 

しかし、これが返されます。

0.04 
0.1 
0.5 
nan 
inf 

私は、なぜ第75分位を理解していませんこのように動作します。それは無限ではありませんか?

答えて

0

私はそれがnumpyのバグかもしれないと思う:

np.percentile([0,1,np.inf], 50) 
Out[63]: nan 

一方

np.median([0, 1, np.inf]) 
Out[65]: 1.0 

が代わりに単にインデックス1での値をとる、それは重みでインデックス1及び2に値をとる1それで、それは0 * infになります。


あなたのケースでは、結果は(df.iloc[5,0] = 1e10、例えば、としてみてください)2.33である必要があります。

関連する問題