あなたがデータを表示しないので、私はいくつかのランダムなデータを生成します。このような外れ値に対処
d <- c(rexp(1e4, 100), runif(100, max=5e4))
hist(d)
を、あなたはログのヒストグラムが、その月を表示することができます解釈が困難:
あなたはデータのサブセットを示すと大丈夫であれば、あなたはFILすることができますアウトライアを動的に(恐らくquantile
を使用して)アウトするか、手動でアウトアウトします。あなたの分析でこの視覚化を示すときに重要なのは、がのプロットのデータを削除する必要がある場合、削除の際に前もってなることです。 (これは、また、省略データの範囲および/または他の特性を含むように有益だろう...簡潔であるが、それは主観的だと実際のデータに基づいて異なります。)
quantile(d, seq(0, 1, len=11))
d2 <- d[ d < quantile(d, 0.90) ]
hist(d2)
txt <- sprintf("(%d points shown, %d excluded)", length(d2), length(d) - length(d2))
mtext(txt, side = 1, line = 3, adj = 1)
d3 <- d[ d < 10 ]
hist(d3)
txt <- sprintf("(%d points shown, %d excluded)", length(d3), length(d) - length(d3))
mtext(txt, side = 1, line = 3, adj = 1)
「plot(density(data))」を試してください。 – Fernando
お返事ありがとうございます。私は実際にヒストグラムも必要とします。なぜなら、パラメータを推定し、ヒストグラムに濃度を描画して、それが適切であることを示すためです。 – mathstackuser123
外れ値は無視できますか?または、2つの異なる範囲を示す2つのヒストグラムを並べて表示します。 – Fernando