2017-06-15 3 views
0

私は2つの異なるデータグループのリコール値を持つデータフレームを持っています。私は以下のコードを使って密度プロットを作ったが、どう見えるか混乱している。 1つのグループ(この場合はGE)について、リコールは非常に高く(常に1)、プロットではx軸= 1でシャープで比較的高いピーク(wrt Epiグループ)が予想されますが、これは出力には当てはまりませんグラフ(添付写真参照)。ggplot2で正しい "densityplot"を得るには?

ggplot(epiGE, aes(x=Rec)) + geom_density(aes(group=Class, colour=Class, fill=Class), alpha=0.3) + theme(axis.title.x=element_blank(), axis.title.y=element_blank()) 

DensityPlot

として、私はまた、私はGEグループの右の分布を得ることはありませんx軸= 1でそこにもggplot2ヒストグラムを試みたが、している:私が使用

コマンドバープロットは、Recall=1を有するEpiグループの値がGEグループと比較してより多いことを示す。

ggplot(epiGE, aes(x=Rec)) + geom_histogram(aes(group=Class, colour=Class, fill=Class), alpha=0.3) + theme(axis.title.x=element_blank(), axis.title.y=element_blank()) 

BarPlot

誰かが私がここで間違ってやっているものを私を導いてくださいことはできますか?ありがとうございました。

> dput(epiGE) 
structure(list(Class = structure(c(1L, 2L, 1L, 2L, 1L, 2L, 1L, 
2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 
2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 
2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L), .Label = c("Epi", "GE"), class = "factor"), 
    Rec = c(1, 1, 0.928571428571429, 1, 1, 1, 0.625, 1, 0.935897435897436, 
    1, 0.911764705882353, 1, 0.790697674418605, 1, 0.891891891891892, 
    1, 1, 1, 0.98019801980198, 1, 0.949367088607595, 1, 0.877551020408163, 
    1, 0.944444444444444, 1, 1, 1, 0.955445544554455, 1, 0.5, 
    1, 0.170731707317073, 1, 0.513513513513513, 1, 0, 1, 0.9, 
    1, 0.875, 1, 0.884615384615385, 1, 0.5, 1, 0.9, 1)), .Names = c("Class", 
"Rec"), class = "data.frame", row.names = c(NA, -48L)) 

答えて

1

これは、平滑化の帯域幅に関連している:

は、ここに私のデータdputです。 adjust引数を使用して帯域幅を調整できます。ここに例があります。 1/10

ggplot(epiGE, aes(x=Rec)) + 
    geom_density(aes(group=Class, colour=Class, fill=Class), alpha=0.3, adjust = 1/10) + 
    theme(axis.title.x=element_blank(), axis.title.y=element_blank()) 

設定adjustは、デフォルトの帯域幅の1/10を使用することを意味します。

+0

お試しいただきありがとうございます。私は既にこのパラメータを試していますが、あなたがプロットを見ると、EpiクラスがGEと比較してRecall = 1を持つより多くのデータポイントを持っているので、赤いピーク(Epiグループを表す)が緑色のピーク(GEグループを表します)これはここでは当てはまりません(両方のクラスの呼び出し値が表示されている場合)。 – Newbie

+0

GEクラスのすべての値がRecall = 1であるのに対し、Recallが0.8〜1の範囲にあるクラスEpiに属する値は7または8だけです。この場合、GE値を表すピークの高さは、 Epi値を表すピークの高さ(領域0.9-1)。しかし、私たちがプロットで見ることは、その反対です。 – Newbie

+0

'adjust = 1/50'はどうですか?密度プロットはあなたが望むものを達成するのに最適なプロットではないかもしれないと感じます。 – www

関連する問題