2017-08-22 49 views
2

hereおよびhereと同じ問題です。しかし、そこの解決策は機能していないようです。ggplot2 facet_wrapすべてのファセットの点、セグメント、テキストをプロットする

私はここでの例のデータを持っています。しかし、私は次のsample_cnsにエントリを持つプロットに注釈を付けるたい

enter image description here

ここに示した所望の塩基プロットを生成
library("ggplot2") 
library("ggrepel") 

# order of the chromosomes 
chrom_order <- c("chr1", "chr2", "chr3", "chr4", "chr5", 
    "chr6", "chr7", "chr8", "chr9", "chr10", "chr11", "chr12", 
    "chr13", "chr14", "chr15", "chr16", "chr17", "chr18", "chr19", 
    "chr20", "chr21", "chr22", "chrX", "chrY", "chrM") 

# data frame of chromosome sizes 
chrom_sizes <- structure(list(chrom = structure(c(25L, 1L, 2L, 3L, 4L, 5L, 6L, 
7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 
20L, 21L, 22L, 23L, 24L), .Label = c("chr1", "chr2", "chr3", 
"chr4", "chr5", "chr6", "chr7", "chr8", "chr9", "chr10", "chr11", 
"chr12", "chr13", "chr14", "chr15", "chr16", "chr17", "chr18", 
"chr19", "chr20", "chr21", "chr22", "chrX", "chrY", "chrM"), class = "factor"), 
    size = c(16571L, 249250621L, 243199373L, 198022430L, 191154276L, 
    180915260L, 171115067L, 159138663L, 146364022L, 141213431L, 
    135534747L, 135006516L, 133851895L, 115169878L, 107349540L, 
    102531392L, 90354753L, 81195210L, 78077248L, 59128983L, 63025520L, 
    48129895L, 51304566L, 155270560L, 59373566L)), .Names = c("chrom", 
"size"), row.names = c(NA, -25L), class = "data.frame") 

# regions to label 
sample_cns <- structure(list(gene = c("AFF1", "ANKRD24", "ARID1A", "CDH23", 
"CDH23-AS1", "CHD5", "CTC-554D6.1", "DCC", "DOT1L", "FLT4"), 
    chromosome = structure(c(4L, 19L, 1L, 10L, 10L, 1L, 5L, 18L, 
    19L, 5L), .Label = c("chr1", "chr2", "chr3", "chr4", "chr5", 
    "chr6", "chr7", "chr8", "chr9", "chr10", "chr11", "chr12", 
    "chr13", "chr14", "chr15", "chr16", "chr17", "chr18", "chr19", 
    "chr20", "chr21", "chr22", "chrX", "chrY", "chrM"), class = "factor"), 
    start = c(87869685L, 4183350L, 27022894L, 73199588L, 73269838L, 
    6166339L, 112162804L, 49867157L, 2164183L, 180030191L), end = c(88056853L, 
    4224502L, 27107247L, 73575035L, 73270969L, 6240083L, 112179823L, 
    51057023L, 2229791L, 180076545L), log2 = c(-1.01818, -0.517649, 
    -1.14236, -0.527636, -0.527636, -1.14236, -0.438652, -0.741936, 
    -0.517649, -0.438652), depth = c(466, 155.508, 304.046, 720.821, 
    1096.83, 253.5, 871.9, 626.033, 160.42, 567.457), weight = c(17.8883, 
    17.0764, 23.296, 52.0485, 1.77117, 25.5399, 22.9053, 19.3831, 
    26.4509, 19.0353), cn = c(1L, 1L, 0L, 1L, 1L, 0L, 1L, 1L, 
    1L, 1L), probes = c(587L, 462L, 1023L, 922L, 922L, 1023L, 
    753L, 465L, 462L, 753L)), .Names = c("gene", "chromosome", 
"start", "end", "log2", "depth", "weight", "cn", "probes"), row.names = c(NA, 
10L), class = "data.frame") 

# base plot 
p <- ggplot(data = chrom_sizes, aes(x = chrom, y = size)) + geom_bar(stat="identity", fill="grey90") + coord_flip() + 
    theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(), panel.background = element_blank(), axis.line = element_line(colour = "black")) + facet_wrap(~ chrom, scales = "free_y") 

print(p) 

データフレーム。 referrenced質問1として

# places labels and lines on every facet 
p + geom_segment(data = sample_cns, aes(x = chromosome, xend = chromosome, y = start, yend = end, colour = cn), size=13) + 
    geom_text_repel(data = sample_cns, aes(x = chromosome, y = start, label = gene)) 

enter image description here

、私は一度に注釈1を追加するために、単一のエントリのデータフレームを渡してみました:私はそれらを追加しようとする。しかし、すべての値は、すべてのプロットに置かれます。しかし、これは依然としてすべての面にデータをプロットします。

# first row only; still adds to every facet 
df <- sample_cns[1, ] 
p + geom_segment(data = df, aes(x = chromosome, xend = chromosome, y = start, yend = end, colour = cn), size=13) + 
    geom_text_repel(data = df, aes(x = chromosome, y = start, label = gene)) 


# make new df from scratch 
df <- data.frame(gene = "AFF1", chromosome = factor("chr4", levels = chrom_order), start = 87869685, end = 88056853, cn = 1) 
p + geom_segment(data = df, aes(x = chromosome, xend = chromosome, y = start, yend = end, colour = cn), size=13) + 
    geom_text_repel(data = df, aes(x = chromosome, y = start, label = gene)) 

p + geom_point(data = df, aes(x = chromosome, y = start, colour = cn), size=13) 

enter image description here enter image description here

任意のアイデア:同じことは、私は最初からデータフレームを再作成して、代わりにそれを渡すようにしようと、それはテキスト、ラインセグメントで発生し、ポイントが渡されるとどうなりますか?私は何が欠けていますか?なぜ、他のコードサンプルでも同じテクニックが動作しますが、ここでは動作しません。

また、私はあなたがそれぞれのラベルが入るファセットたggplotを指示する必要がRのバージョン3.2.3、およびggplot2バージョン2.2.1

+4

「chrom」、「facet_wrap(〜chrom)」という列に面しています。 'cns'というラベルのデータフレームには' chrom'という名前のカラムがありません。したがって、それはあらゆるファセットの一部です。ラベルが特定のファセットにのみ表示されるようにするには、 'cns'に 'chrom'という名前のカラムを付けて、各ラベルがどのファセットに属するべきかを表示します。 – Gregor

+0

ありがとうございました。 – user5359531

+0

@Gregorあなたが回答として投稿した場合、私はそれを受け入れるでしょう – user5359531

答えて

1

を使用しています。これは、(ラベルを含むデータフレームが列を持っている必要があります意味しますあなたは面倒です。

chromfacet_wrap(~ chrom)と呼ばれる列に面しています。ラベルのデータフレームcnsには、chromという列がありません。 chromという列をcnsに追加して、各ラベルをどのファセットに含めるべきかを示します。

関連する問題