2017-01-19 11 views
1

関数が2つ以上の値を返し、fill = NAを使用した場合、rollapplyははるかに遅くなります。 これを避ける方法はありますか? rollapply()関数内部で起こるようなぜfillapplyがfill = NAではるかに遅く、関数が複数の値を返すのですか?

f1= function(v)c(mean(v)+ median(v)) #return vector of length 1 
f2= function(v)c(mean(v), median(v)) #return vector of length 2 


v = rnorm(1000) 
microbenchmark(rollapplyr(v, 20, f1), rollapplyr(v,20, f1, fill=NA)) 

#        expr  min  lq  mean median  uq  max neval 
#   rollapplyr(v, 20, f1) 50.84485 53.68726 57.21892 54.63793 57.78519 75.88305 100 
# rollapplyr(v, 20, f1, fill = NA) 52.11355 54.69866 59.73473 56.20600 63.10546 99.96493 100 

microbenchmark(rollapplyr(v, 20, f2), rollapplyr(v,20, f2, fill=NA)) 

#        expr  min  lq  mean median  uq  max neval 
#   rollapplyr(v, 20, f2) 51.77687 52.29403 56.80307 53.44605 56.65524 105.6713 100 
# rollapplyr(v, 20, f2, fill = NA) 69.93853 71.08953 76.48056 72.21896 80.58282 151.4455 100 
+2

1-あなたが使用しているパッケージを指定していません。 2 - あなたは測定単位を示していません。それは、追加の操作を行うための小さなペナルティのようです。 3-スピードチェックアウトを改善したい場合は、https://cran.r-project.org/web/packages/RcppRoll/RcppRoll.pdf –

+0

余分な時間は上記の「v」の長さと線形であるようです。 – user3226167

答えて

3

理由は、異なるタイプのデータにfill.naを使用しての速度で発見されます。 f1は単一のベクトルを返しますが、f2は2つの列の行列を返します(どちらも実際にはzooオブジェクトですが、私のドリフトをキャッチします)。

これが示すようにNAを挿入するための速度低下は、要素数の単なる倍増に比例していない:

library(zoo) 
library(microbenchmark) 

v <- zoo(rnorm(1000)) 
m <- zoo(matrix(rnorm(2000), ncol=2)) 
ix <- seq(1000)>50 
microbenchmark(na.fill(v, NA, ix), na.fill(m, NA, ix)) 

# Unit: microseconds 
#    expr  min  lq  mean median   uq  max neval 
# na.fill(v, NA, ix) 402.861 511.912 679.1114 659.597 754.8385 4716.46 100 
# na.fill(m, NA, ix) 9746.643 10091.038 14281.5598 14057.304 17589.9670 22249.96 100 
関連する問題