1
を使用して大規模なN
のために(2e6
言う)Hmisc
パッケージ内cut2
機能は、私は、私のデータの分位数を取得しようとしているエラー大きなNのためHmiscパッケージにCUT2
y = cut2(rnorm(2000000,0,1),m=sqrt(2000000))
Error in if (cj == upper) next : missing value where TRUE/FALSE needed
In addition: Warning message:
In (1:g) * nnm : NAs produced by integer overflow
を投げるようですm
は各分位点を指し、各分位点の終点も記録する。 cut2
これを行いますが、大型の場合はそれほどうまくいかないN
。より良い選択肢はありますか?
私が見始めているとして、いくつかのわずかな違いがあります。 'cut2'は各ビンの観測の最小数として' m'を使いますが、 'cut3'は各ビンに厳密に同じ観測数を強制します。後者は、いくつかの観察結果が容器に入れられない結果となる。これを 'quantile'と' cut'で変えることは可能ですか? – stats134711