私は、numpy
を使用して、Pythonで値の配列の四分位数を計算しようとしています。np.percentileが四捨五入と等しくない
X = [1, 1, 1, 3, 4, 5, 5, 7, 8, 9, 10, 1000]
私は、次の操作を行います:
quartiles = np.percentile(X, range(0, 100, 25))
quartiles
# array([1. , 2.5 , 5. , 8.25])
しかし、第一と第三四分位数はそれぞれ、2および8.5でなければなりませんので、これは、間違っています。
これは、次のように示すことができる。
Q1 = np.median(X[:len(X)/2])
Q3 = np.median(X[len(X):])
Q1, Q3
# (2.0, 8.5)
私はnp.percentile
が異なる答えを与えるためにやっていることの周りに私の頭を取得することはできません。この上に光が出て、私は非常に感謝しています。