多くの点が重なると、散布図を解釈するのが難しくなります。そのような重なりは特定の領域のデータ密度を不明瞭にします。 1つの解決策は、プロットされた点に半透明の色を使用することであり、不透明領域は、それらの座標に多くの観測値が存在することを示します。R散布図:シンボルの色は重複する点の数を表します。
以下はRで私の黒と白のソリューションの一例です:
MyGray <- rgb(t(col2rgb("black")), alpha=50, maxColorValue=255)
x1 <- rnorm(n=1E3, sd=2)
x2 <- x1*1.2 + rnorm(n=1E3, sd=2)
dev.new(width=3.5, height=5)
par(mfrow=c(2,1), mar=c(2.5,2.5,0.5,0.5), ps=10, cex=1.15)
plot(x1, x2, ylab="", xlab="", pch=20, col=MyGray)
plot(x1, x2, ylab="", xlab="", pch=20, col="black")
しかし、私は最近、同様のアプローチを取っている、this article in PNAS渡って来たが、ヒートマップの配色を使用しましたオーバーラップしているポイントの数の指標としての不透明度とは対照的である。記事はOpen Accessですので、誰でも.pdfをダウンロードして、図1を見てください。図1に、作成したいグラフの関連例を示します。このペーパーのメソッドセクションは、解析がMatlabで行われたことを示しています。私は色ではなく、不透明度を用いRにおける散布図を作成する方法を
:便宜上
は、ここで上記の記事から、図1の小さい部分でありますポイント密度の指標?
初心者の方は、tim.colors()
を使用して、install.packages("fields")
ライブラリのMatlab配色にアクセスできます。
上記の図1と同様の図を作成する簡単な方法はありますか?ありがとう!
+10もしできればさらに高い投票をするでしょう。 –
これはまさに私が望んでいた答えと思われる...ありがとう! – rbatt
@JoshOBrien:これは素晴らしいです! 2つの質問: 1)答えに画像をどのように追加できましたか? 2)ここに凡例を追加するには? – Shambho