この質問はStackOverflowの質問の拡張であり、hereと回答しました。データフレーム列のパーセンタイルを効率的に計算する
私の状況は、50,000(またはそれ以上)の値のベクトル内の各値のパーセンタイルを計算したいという点で異なります。たとえば、 -
df <- data.frame(val = rnorm(n = 50000, mean = 50, sd = 20))
df$val.percentile <- sapply(X = df$val, function(x) ecdf(df$val)(x))
head(df)
各値のパーセンタイルを計算するプロセスを最適化する良い方法はありますか?基本的にはできるだけ効率的にして、実行時間をできるだけ短くしたいと思っています。
この回答はどのように私のものと異なっていましたか? –
@ 42-それはないが、あなたとBarkerはほぼ同時に(Barkerが最初に)投稿した。 – Jaap
私が投稿しているとき(または私の編集をしている時)、見なかった。私はそれが後で来たと仮定していた。 –