2017-11-17 12 views
1

私は線形回帰から得られた結果を再現することになっていました(1360の観測値と52の変数を持つ時系列データ(回帰モデルの11変数) )。元の研究では、研究者はHadi法で外れ値を特定した。これはmvBacon関数を使ってRで一番うまくいくようですが、これは正しいですか?私はこれを使用する方法についての良い答えを見つけることができないようだ誰も私が異常値を見つけるためにこの関数を使用することができます教えてください? (私は非常にRが私にとって非常に新しいので、私は可能な限り簡単に説明されている答えを非常に感謝します)。 ありがとうございます!R:mvBACONで外れ値を見つける

答えて

1

はい、mvBACONはある距離に基づく外れ値の識別用です。デフォルトのものはマハラノビスの距離です。 次のコードでは、mvcACONで異常値を特定する方法について、mtcarsサブデータセットの簡単な例を紹介します。

# Use mtcars (sub)dataset and plot it 
data <- mtcars %>% select(mpg, disp) 
plot(data, main = "mtcars") 

# Add some outliers and plot again 
data <- rbind(data, 
       data.frame(mpg = c(1, 80), disp = c(800, 1000))) 
plot(data, main = "mtcars") 

# Use mvBacon to calculate the distances and get the ouliers 
library(robustX) 
distances <- mvBACON(data) 
# Plot it again... 
plot(data, main = "mtcars") 
# ...with highlighting the outliers 
points(data[!distances$subset, ], col = "red", pch = 19) 

# Some fine tuning, since lot of outliers seem to be still good for regression 
distances <- mvBACON(data, alpha = 0.6) 
plot(data, main = "mtcars") 
points(data[!distances$subset, ], col = "red", pch = 19) 
関連する問題