とクラスタデンドログラムの相関IはRで行われ、次のプロットを持っている: R:密度プロット
Iプロットを作るために、次のコードを使用する:
par(mfrow=c(1,2))
rmsd <- read.table(textConnection("
pdb rmsd
1grl_edited.pdb 1.5118
1oel_edited.pdb 1.1758
1ss8_edited.pdb 0.8576
1gr5_edited.pdb 1.8301
1j4z_edited.pdb 0.7892
1kp8.pdb 0.1808
1kpo_edited.pdb 0.7879
1mnf.pdb 1.2371
1xck.pdb 1.6820
2c7e_edited.pdb 5.4446
2cgt_edited.pdb 9.9108
2eu1.pdb 54.1764
2nwc.pdb 1.6026
2yey.pdb 61.4931
"), header=TRUE)
dat <- read.table(textConnection("
pdb PA EHSS
1gr5_edited.pdb 21518.0 29320.0
1grl_edited.pdb 21366.0 28778.0
1j4z_edited.pdb 21713.0 29636.0
1kp8.pdb 21598.0 29423.0
1kpo_edited.pdb 21718.0 29643.0
1mnf.pdb 21287.0 29035.0
1oel_edited.pdb 21377.0 29054.0
1ss8_edited.pdb 21543.0 29459.0
1sx3.pdb 21651.0 29585.0
1xck.pdb 21191.0 28857.0
2c7e_edited.pdb 22930.0 31120.0
2cgt_edited.pdb 22807.0 31058.0
2eu1.pdb 22323.0 30569.0
2nwc.pdb 21338.0 29326.0
2yey.pdb 21032.0 28670.0
"), header=TRUE, row.names=NULL)
d <- dist(rmsd$rmsd, method = "euclidean")
fit <- hclust(d, method="ward")
plot(fit, labels=rmsd$pdb)
groups <- cutree(fit, k=3)
rect.hclust(fit, k=3, border="red")
#for (i in dat[1]){for (z in i){ if (z=="1sx3.pdb"){print (z)}}}
den.PA <- density(dat$PA)
plot(den.PA)
for (i in dat$PA){
lineat = i
lineheight <- den.PA$y[which.min(abs(den.PA$x - lineat))]
lines(c(lineat, lineat), c(0, lineheight), col = "red")
}
左のプロットに示します右側のプロットは "PA"の密度プロットを示しています。参照がプロットに含まれていたので、密度プロットは、余分な値が含まれて明らかにそれはdat
で参照ファイルは、クラスタのプロットがあり1sx3.pdb
で0の値を返しますので、参照はRMSDクラスタに含まれていませんでした3つの赤いボックスは、どうやって色を変えることができますか?左のボックスは赤、中央のボックスは緑、右のボックスは青です。私は密度プロットでミラーリングする必要があります。つまり、赤いボックスの中の値は密度プロット上に赤い線を持ち、緑のボックスの中の値は密度プロットなどの上に緑色の線を持っています。
参照構造をキャッチし、密度プロットで黒色にすることもできますか?
をシフトし、私は次のいずれかをトリミングしなければなりませんでしたデータセットが一致しなかったので、最初に 'dat'からの行。 –
ちょっと、答えのためのthx。余分な行は、私の質問に記載されている参照構造です。 – Harpal
作品は完璧に感謝:) – Harpal