2016-10-18 6 views
-1

で表記しました。このスクリプトは、データの外れ値を特定して削除するために使用しました。このコードでは、検出された異常値を削除するかどうかを選択できます。ここでは、コードとそれのために記事へのリンクも:外れ値をR

https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/

私は何をしたいことは、外れ値を削除するが、それらをコピーするために、それらと異なるデータセットを作成できません。たとえば、もし私が100 000レコードのデータセットを持っていて、このスクリプトで3500個の異常値が検出されたら、それらの3500レコードを取り出し、それらを含むデータセット全体を作成して、後で追加分析を行うことができます。私は元のデータセットからそれらを削除したくありません。

これを行う方法はありますか?ありがとうございました!

例:

var1 var2 
a  15  
b  1 
c  2 
d  1 
e  3 

アルゴリズムは、1

var1 var2 
a  15 

その行を認識外れ値Isとソートの何かを表示:検出

外れ値:1 割合:20%

などなど。しかし、スクリプトは私に外れ値だけを含む別個のデータセットを与えません。それ、どうやったら出来るの?お願いします?

+2

はStackOverflowのへようこそ。 [MCVE] –

+0

@StevenBeaupréを入力してください。質問を編集しました。私は情報と例として私が与えることができるものが実際には何もないので、これで十分であると思います。 –

答えて

1

あなたは使用して外れ値を得ることができます:boxplot.stats(x)$out