2017-03-06 8 views
0

ggplotを使用してヒストグラムを作成する際に問題があります。ggplotヒストグラムの値にbinwidthを設定します。

次のように私は、データ構造を持っている:

value_1 
112.45 
2457.44 
333.24 

をと値のリストは、約25000以上の観察のために続けています。

頻度の値が0〜100、次に100〜200、および200〜300の範囲のビンを持つヒストグラムがすべて値の上限まで必要です。

上記の例では、ビン100-200に1カウント、ビン300-400に1カウント、ビン2400-2500に1カウントを与えます。

あなたは正しい方向に私を助けてくれますか?

+0

関連記事:http://stackoverflow.com/questions/21031060/setting-breaks-in-ggplot2-histogram – zx8754

+0

@ mt1022次に、これは正しい複製ですhttp://stackoverflow.com/questions/15231109/stacked-すでに集計したヒストグラムから、ggplot2を使用してください。 – zx8754

+0

@ zx8754残念ながら、そうではありません。この質問では、OPが望んでいるのは、 'geom_histogram'に' binwidth 'と 'center'または' boundary'を同時に設定しているようです。 – mt1022

答えて

1

あなたは同時にbinwidthcenterまたはboundaryのいずれかを設定することで、右のビン幅を設定することができます。

df <- data.frame(x = c(112.45, 2457.44, 333.24)) 

library(ggplot2) # 2.2.1 
ggplot(df, aes(x)) + geom_histogram(binwidth = 100, center = 150) 
# or 
ggplot(df, aes(x)) + geom_histogram(binwidth = 100, boundary = 100) 

センター

ビンの一つの中心地。 centerがcenterより大きい場合、または がデータの範囲より小さい場合は、適切な の幅の数だけシフトされます。例えば、整数を中心にするには、0がデータの範囲外であっても、width = 1 とcenter = 0を使用します。たかだか センターと境界のいずれかを指定できます。

境界

境界 2の間のビン。中心と同様に、データの範囲外の境界が の場合、物はシフトされます。たとえば、整数を中心にするには、0.535が データの範囲外であっても、 のwidth = 1およびboundary = 0.5を使用します。多くの場合、中心と境界の1つを指定することができます。

データ範囲がわかっている場合は、breaks =を手動でgeom_histogramに設定することもできます。

関連する問題