分位数と1.5 * IQRを使用してデータフレームの異常値を調べたいとします。私はboxplot関数を使い、結果のアウトライアをquantilesとiqrを使って計算されたoutlierと比較しました。boxplotを使用して異常値が検出されない
私は2つの方法の違いに気づいています。 boxplot法は、Q1-1.5 * IQR、Q3 + 1.5 * IQR計算よりも異常値が少ないことを検出します。私はboxplotのrange
を1.5に設定しようとしましたが、依然としてより少ないアウトライヤーを検出します。範囲は、設定する正しいboxplotオプションか、設定する必要がある別のオプションがありますか?
ご協力いただきまして誠にありがとうございます。
x <- c(-8.4849, -8.4848, -8.8485, -8.4848, -8.4848, -8.4848, -8.7879, -8.4848,
-8.4849, -8.6061, -8.3838, -8.2424, -8.4849, -8.3636, -8.2424, -8.7273)
qnt = quantile(x, probs=c(.25, .75))
iqt = 1.5 * IQR(x)
x[x < (qnt[1] - iqt)]
[1] -8.8485 -8.7879 -8.6061 -8.7273
x[x > (qnt[2] + iqt)]
[1] -8.2424 -8.3636 -8.2424
boxplot(x, range = 1.5)$out
[1] -8.8485 -8.7879 -8.2424 -8.2424 -8.7273
の定義を参照してください'?boxplot.stats'ヘルプページの「ヒンジ」を参照してください。 'boxplot'からの値は+/-分位数ではなく、+/-ヒンジです。 – MrFlick