私は操作中に浮動小数点値を計算しています。私はそれらをすべてメモリに保存するのではなく、コレクションの大まかな配布を保存したいと思います。単一の値を保存せずに確率分布を保存する
私の考えは、すべての値の指数を決定し、それらをヒストグラムで数えることでした。しかし、これはもちろん、値が異なる指数を持つ場合にのみ機能します。
どのように私は配布がどのように見えるか知らずにこれを行うことができるアイデアはありますか?
私は操作中に浮動小数点値を計算しています。私はそれらをすべてメモリに保存するのではなく、コレクションの大まかな配布を保存したいと思います。単一の値を保存せずに確率分布を保存する
私の考えは、すべての値の指数を決定し、それらをヒストグラムで数えることでした。しかし、これはもちろん、値が異なる指数を持つ場合にのみ機能します。
どのように私は配布がどのように見えるか知らずにこれを行うことができるアイデアはありますか?
私はランダムにいくつかを保存し、それから事実の後にヒストグラムを作成することをお勧めします。たとえば、数値の0.1%をランダムに保存すると、100,000を保存するだけで済み、非常に正確な分布を計算できます。
数字を保存して1..2000
の範囲の乱数を見つけるたびに呼び出すことで、rand()の呼び出し回数を減らすことができます。
最小値と最大値をおおよそ知っていれば、ビニング戦略が良い選択だと思います。ここで私が言いたいのアウトラインです:あなたは私のすべての番号については を必要とするどのように多くのビン
図アウトは、この数はビン
は、別の有用な代替が上計算するだろう 増分に行くことビンを探す 分布の瞬間を-the-飛ぶ、その後、瞬間
https://en.wikipedia.org/wiki/Method_of_moments_(statistics)
https://www.wias-berlin.de/people/john/ELECTRONIC_PAPERS/JAOT07.CES.pdf
からそれをPDFを再構築あなたがどんなに荒いかに依存します。また、価値の範囲について考えていますか?それらはすべて0から100万の間ですか? –