1
census dataset for last nameと名前のオカレンスはcumulative frequency
とfrequency
です。どのように私は実際の世界で発生したものの中から選択される可能性の高い名前でランダムな名前を取得するのですか?累積頻度を考慮した乱数関数
census dataset for last nameと名前のオカレンスはcumulative frequency
とfrequency
です。どのように私は実際の世界で発生したものの中から選択される可能性の高い名前でランダムな名前を取得するのですか?累積頻度を考慮した乱数関数
ランダムな実数を0-100の範囲で生成し、累積頻度データセットの対応するエントリを探します。
例、あなたの乱数はx = 19.41
です。それは以上のことかテーブルに見て(累積頻度順にソート)以上または、この例ではx
WALLACE 0.081 19.315 106
WOODS 0.080 19.395 107
COLE 0.080 19.476 108
WEST 0.080 19.555 109
JORDAN 0.078 19.634 110
よりも等しい値を持つ最初のものを見つけ、あなたは「COLE」
を取得Xに?最初の名前はスミスで、累積頻度は1.006です。もし私が0.6584を得たら、どうやってそれをやりますか? –
リンクされたデータセットでは、cumfreqの最大値は100ではなく90.483です。つまり、90.483-100.000(約10%)の間のすべての乱数に対して、AARDEMAを表示する必要がありますか?それは正しいことではありません。私は私の人生の中で一つのAARDEMAに会ったことは一度もありません。 –
@エヴァン最後の10%は非常にまれな名前で構成されています。リストに入れると、ダウンロードにはギガバイトがかかります。あなたはちょうど90.483%の最も頻繁な名前を持っています。 – Ishtar