いくつかのソースではなく、PRNGからシーケンスPF番号N
, N
, N
...
を考えるが、いくつかの種類のセンサーやログデータを言って、この数字のどの部分がより多くのエントロピーを持っていますか?
N
n
/ B = Q
NRem M
n
シーケンスM
未満のエントロピーをhaveingシーケンスQ
になりますか?
注:は、Q
とM
の両方が同じサイズの範囲であるとします。
これはthe observation that most real world data sets, regardless or there source, have a logarithmic distributionに関連しています。 1から始まる数字は9から始まる数字よりはるかに一般的です。しかし、これは低次の部分についてはほとんど言及していません。
ll -R 2>/dev/null | grep -v -e "^\./" | sed "s/[-rdwxlp]*\W*[0-9]*\W*[a-z]*\W*[a-z]*\W*\([0-9]\).*/\1/" | sort | uniq -c
をし、ファイルサイズの最初の数字のヒストグラムを取得:これをテスト(と自分のコンピュータを停滞によって、あなたのsys管理者を怒ら)bashでこれを実行するための楽しい方法について
。
いくつかのPRNGのIIRCではQが少なくなります。 – BCS
ちょうど悪いPRNGsの場合、エントロピーの差は、MSVCのようないくつかの本当に悪いものを取る場合を除いて、最小になります。 – schnaader
私は間違ってはいけませんが、普通のセンサーデータ(温度のような)はもちろん下位ビットでしか変化しないので、Qnはより低いエントロピーを持つでしょう。しかし、私の指摘は、これはすべての種類のデータに当てはまりません。 – schnaader