2017-04-16 5 views
0

を決定し、我々は関連する関数ecdfを計算し、プロットすることができますは、我々はランダムにサンプリングされた分布を持っていると仮定すると経験分布におけるジャンプ

set.seed(1) 
t1 <- rnorm(10000,mean=20) 
t1 <- sort(t1) 
t1[1:1000] <- t1[1:1000]*(-100) 
t1[1001:7499] <- t1[1001:7499]*50 
t1[7500:10000] <- t1[7500:10000]*100 
cdft1 <- ecdf(t1) 
plot(cdft1) 

今、この場合には、経験的で(意図で作成された)ジャンプがあります分布。ジャンプすると、それは以前よりも100%以上も上がったと言いましょう。これは、位置7,500の例で起こります。私の質問は、これらの「ジャンプ」インデックスを最も効果的に見つける方法は?

答えて

2

ソートされたt1値のdiffを見るだけで、すぐ近くに近づくことができます。ポイント1000

St1 = sort(t1) 
which(diff(St1) > abs(St1[-length(St1)])) 
[1] 1000 7499 

は、ST1は-1632.8700から技術的には "100%以上の変動" のあなたの基準を満たしている934.6916、に切り替わります。このような符号の変化があるときには、何が欲しいのかはわかりません。

関連する問題