2017-03-01 8 views
2

ggplot2を使用して散布図オーバーレイでグループ化されたボックスプロットを作成しています。私はそれに対応するグループ化されたboxplotと各散布図データポイントをグループ化したいと思います。ggplot2を使用したRのグループ化されたボックスプロットに対するグループ化された散布図

しかし、散布図の点も異なる記号にしたいと思います。私は、私の散布図の点を私のグループ化したボックスでグループ化したり、散布図の点を異なる記号にすることができるようですが、同時に両方ではありません。以下は、何が起こっているかを示すためのコードの例です:

library(scales) 
library(ggplot2) 

# Generates Data frame to plot 
Gene <- c(rep("GeneA",24),rep("GeneB",24),rep("GeneC",24),rep("GeneD",24),rep("GeneE",24)) 
Clone <- c(rep(c("D1","D2","D3","D4","D5","D6"),20)) 
variable <- c(rep(c(rep("Day10",6),rep("Day20",6),rep("Day30",6),rep("Day40",6)),5)) 
value <- c(rnorm(24, mean = 0.5, sd = 0.5),rnorm(24, mean = 10, sd = 8),rnorm(24, mean = 1000, sd = 900), 
      rnorm(24, mean = 25000, sd = 9000), rnorm(24, mean = 8000, sd = 3000)) 
    value <- sqrt(value*value) 
     Tdata <- cbind(Gene, Clone, variable) 
     Tdata <- data.frame(Tdata) 
      Tdata <- cbind(Tdata,value) 

# Creates the Plot of All Data 
# The below code groups the data exactly how I'd like but the scatter plot points are all the same shape 
# and I'd like them to each have different shapes.       
ln_clr <- "black" 
bk_clr <- "white" 
point_shapes <- c(0,15,1,16,2,17) 
blue_cols <- c("#EFF2FB","#81BEF7","#0174DF","#0000FF","#0404B4") 

lp1 <- ggplot(Tdata, aes(x=variable, y=value, fill=Gene)) + 
    stat_boxplot(geom ='errorbar', position = position_dodge(width = .83), width = 0.25, 
       size = 0.7, coef = 4) + 
    geom_boxplot(coef=1, outlier.shape = NA, position = position_dodge(width = .83), lwd = 0.3, 
        alpha = 1, colour = ln_clr) + 
    geom_point(position = position_jitterdodge(dodge.width = 0.83), size = 1.8, alpha = 0.7, 
       pch=15) 


lp1 + scale_fill_manual(values = blue_cols) + labs(y = "Fold Change") + 
    expand_limits(y=c(0.01,10^5)) + 
    scale_y_log10(expand = c(0, 0), breaks = c(0.01,1,100,10000,100000), 
        labels = trans_format("log10", math_format(10^.x))) 

ggsave("Scatter Grouped-Wrong Symbols.png") 

#************************************************************************************************************************************* 
# The below code doesn't group the scatterplot data how I'd like but the points each have different shapes 
lp2 <- ggplot(Tdata, aes(x=variable, y=value, fill=Gene)) + 
    stat_boxplot(geom ='errorbar', position = position_dodge(width = .83), width = 0.25, 
       size = 0.7, coef = 4) + 
    geom_boxplot(coef=1, outlier.shape = NA, position = position_dodge(width = .83), lwd = 0.3, 
        alpha = 1, colour = ln_clr) + 
    geom_point(position = position_jitterdodge(dodge.width = 0.83), size = 1.8, alpha = 0.7, 
       aes(shape=Clone)) 


lp2 + scale_fill_manual(values = blue_cols) + labs(y = "Fold Change") + 
    expand_limits(y=c(0.01,10^5)) + 
    scale_y_log10(expand = c(0, 0), breaks = c(0.01,1,100,10000,100000), 
        labels = trans_format("log10", math_format(10^.x))) 

ggsave("Scatter Ungrouped-Right Symbols.png") 

誰かが何か提案があれば、本当にありがたいです。

は箱ひげ図が表示されるように取得するには、あなたに ネイサン

答えて

5

ありがとう、shape美的ではなくggplotする主な呼び出しに比べ、geom_point内である必要があります。その理由は、shape審美的なものがメインのggplot呼び出しにあるとき、それはgeom_boxplotを含むすべてのギオムに適用されるからです。しかし、shape=Clone審美的に適用すると、Cloneの各レベルに対して別々のボックスプロットを作成するためにgeom_boxplotが発生します。 variableCloneの組み合わせごとに1行のデータしかないので、ボックスプロットは生成されません。

shape審美的にはgeom_boxplotが私には直観に反しているようですが、私が気付いていない理由があるかもしれません。いずれにしても、shape審美的なものをgeom_pointに移動すると、shape審美的なものをgeom_pointに適用することによって問題を解決します。

次に、正しいボックスプロットを表示するには、groupGeneが必要です。私も(それはまだ非常に忙しいのですが)、それが簡単にプロットを参照できるようにすることtheme_classicを追加しました:

ggplot(Tdata, aes(x=variable, y=value, fill=Gene)) + 
    stat_boxplot(geom ='errorbar', width=0.25, size=0.7, coef=4, position=position_dodge(0.85)) + 
    geom_boxplot(coef=1, outlier.shape=NA, lwd=0.3, alpha=1, colour=ln_clr, position=position_dodge(0.85)) + 
    geom_point(position=position_jitterdodge(dodge.width=0.85), size=1.8, alpha=0.7, 
      aes(shape=Clone, group=Gene)) + 
    scale_fill_manual(values=blue_cols) + labs(y="Fold Change") + 
    expand_limits(y=c(0.01,10^5)) + 
    scale_y_log10(expand=c(0, 0), breaks=10^(-2:5), 
       labels=trans_format("log10", math_format(10^.x))) + 
    theme_classic() 

enter image description here

私はあなたがGene、xのファセットを使用する場合、プロットは理解することが容易になるだろうと思いますvariableの軸。 x軸に時間を置くと直感的に見えますが、ファセットを使用するとポイントの色が美しくなります。 6つの異なるクローンでは、ポイントマーカーを区別するのはまだ難しいですが(少なくとも私にとっては)、これは以前のバージョンよりも綺麗に見えます。

library(dplyr) 

ggplot(Tdata %>% mutate(Gene=gsub("Gene","Gene ", Gene)), 
     aes(x=gsub("Day","",variable), y=value)) + 
    stat_boxplot(geom='errorbar', width=0.25, size=0.7, coef=4) + 
    geom_boxplot(coef=1, outlier.shape=NA, lwd=0.3, alpha=1, colour=ln_clr, width=0.5) + 
    geom_point(aes(fill=Clone), position=position_jitter(0.2), size=1.5, alpha=0.7, shape=21) + 
    theme_classic() + 
    facet_grid(. ~ Gene) + 
    labs(y = "Fold Change", x="Day") + 
    expand_limits(y=c(0.01,10^5)) + 
    scale_y_log10(expand=c(0, 0), breaks=10^(-2:5), 
       labels=trans_format("log10", math_format(10^.x))) 

enter image description here

あなたが本当にポイントを維持する必要がある場合は、多分いくつかの手動覆い焼きと箱ひげ図とポイントを分離する方が良いでしょう:

set.seed(10) 
ggplot(Tdata %>% mutate(Day=as.numeric(substr(variable,4,5)), 
         Gene = gsub("Gene","Gene ", Gene)), 
     aes(x=Day - 2, y=value, group=Day)) + 
    stat_boxplot(geom ='errorbar', width=0.5, size=0.5, coef=4) + 
    geom_boxplot(coef=1, outlier.shape=NA, lwd=0.3, alpha=1, width=4) + 
    geom_point(aes(x=Day + 2, fill=Clone), size=1.5, alpha=0.7, shape=21, 
      position=position_jitter(width=1, height=0)) + 
    theme_classic() + 
    facet_grid(. ~ Gene) + 
    labs(y="Fold Change", x="Day") + 
    expand_limits(y=c(0.01,10^5)) + 
    scale_y_log10(expand=c(0, 0), breaks=10^(-2:5), 
       labels=trans_format("log10", math_format(10^.x))) 

enter image description here

ワン今後の参考に、データ作成コードを簡略化することができます:

Gene = rep(paste0("Gene",LETTERS[1:5]), each=24) 
Clone = rep(paste0("D",1:6), 20) 
variable = rep(rep(paste0("Day", seq(10,40,10)), each=6), 5) 
value = rnorm(24*5, mean=rep(c(0.5,10,1000,25000,8000), each=24), 
       sd=rep(c(0.5,8,900,9000,3000), each=24)) 

Tdata = data.frame(Gene, Clone, variable, value) 
+1

これはおそらく私が今までに見た中で最高の、最も徹底的でよく明確な答えでした。手伝ってくれてどうもありがとう。あなたが書いたものはすべて信じられないほど役に立ちました。もし私が何とかあなたが賞賛よりも多くの信用を与えることができれば、私はどれほど素晴らしいだろうか。ありがとうございました。 – Nathan

+0

ありがとう、ネイサン!貴方のご親切に感謝します。 – eipi10

関連する問題