私は、次のような形式を持つデータフレームを持っている:Rの集計データからヒストグラムを作成するにはどうすればよいですか?
Month Frequency
2007-08 2
2010-11 5
2011-01 43
2011-02 52
2011-03 31
2011-04 64
2011-05 73
私は(Xは、おそらく約15になりますが、実際のデータを持っているXビンを使用して、このデータからヒストグラムを作成したいですヒストグラムの各ビンの頻度として頻度列からのデータを使用して、どうすればこれを達成できますか?
これまで、hist()とbarplot()コマンドを使って2つのアプローチを試しました。 hist()の問題は、ヒストグラムの頻度計算で周波数列を使用するよう指定する方法がないように見えることです。 barplot()の問題は、私がXビンを選択する際に柔軟性がないことです。x軸が連続していないため、結果のグラフは実際のヒストグラムではありません。
今私が持っている唯一のアイデアは、barplot()アプローチを使い、Frequencyの値が0の欠落月を記入し、スペース= 0を使用してバーの間隔を取り除くことです。その問題は、任意の数のビンを選択することが特に簡単ではないということです。
私が質問したとき、私は単純な例ではなく、私の周波数が実際には1億から5千万以上に及んでいると言わなかったので、私はそれをあまりにも単純化しました。これらの周波数は高すぎて、私のマシン(8 GB RAM)の生データに 'rep'を使用できませんでした。これらの周波数を私の目的のために十分なヒストグラム(確率分布)を与えたより小さなスケール(1〜100,000)に変換しました。私は一般的にあなたの答えが好きです、そして、これまで私が "本当の"ヒストグラムを与える私が見つけた唯一の解決策です。ありがとう! –
あなたの頻度が高すぎる場合は、 expdat < - dat [rep(1:n、times = dat $ f/1000)、 "x"、drop = FALSE]のように周波数係数を単純に小さくすることができます – Marian