2017-03-24 7 views
1

長さ444000のデータと呼ばれるベクトルがあり、大部分の数値は1〜100(ほとんどすべて)です。私はヒストグラムを描き、その上に適切な濃度を描きたい。私は実際にはより詳細なヒストグラムを見るために何ができるR - ヒストグラムデータの大きさのために濃度が表示されない

hist(data,freq=FALSE) 

enter image description here

:しかし、私はこれを取得ヒストグラムを描きますか?ブレークコードを使用しようとしましたが、それは助けになりましたが、ヒストグラムはとても小さいので実際には難しいです。たとえば、私は= 2000休憩を使用して、この得た:

enter image description here

を私が行うことができるものはありますか?ありがとう!

+0

「plot(density(data))」を試してください。 – Fernando

+0

お返事ありがとうございます。私は実際にヒストグラムも必要とします。なぜなら、パラメータを推定し、ヒストグラムに濃度を描画して、それが適切であることを示すためです。 – mathstackuser123

+0

外れ値は無視できますか?または、2つの異なる範囲を示す2つのヒストグラムを並べて表示します。 – Fernando

答えて

3

あなたがデータを表示しないので、私はいくつかのランダムなデータを生成します。このような外れ値に対処

d <- c(rexp(1e4, 100), runif(100, max=5e4)) 
hist(d) 

enter image description here

を、あなたはログのヒストグラムが、その月を表示することができます解釈が困難:

enter image description here

あなたはデータのサブセットを示すと大丈夫であれば、あなたはFILすることができますアウトライアを動的に(恐らくquantileを使用して)アウトするか、手動でアウトアウトします。あなたの分析でこの視覚化を示すときに重要なのは、のプロットのデータを削除する必要がある場合、削除の際に前もってなることです。 (これは、また、省略データの範囲および/または他の特性を含むように有益だろう...簡潔であるが、それは主観的だと実際のデータに基づいて異なります。)

quantile(d, seq(0, 1, len=11)) 
d2 <- d[ d < quantile(d, 0.90) ] 
hist(d2) 
txt <- sprintf("(%d points shown, %d excluded)", length(d2), length(d) - length(d2)) 
mtext(txt, side = 1, line = 3, adj = 1) 

enter image description here

d3 <- d[ d < 10 ] 
hist(d3) 
txt <- sprintf("(%d points shown, %d excluded)", length(d3), length(d) - length(d3)) 
mtext(txt, side = 1, line = 3, adj = 1) 

enter image description here

+0

お返事ありがとう!それは助けになった! – mathstackuser123