2017-05-04 16 views
1

私はRの私のサンプルでPCAを行うためにデータを転置する必要があるのだろうかと思っていました。私は組み込み関数prcomp()を使用しています。私のデータセットはRNA seq発現データであり、カラムはサンプルであり、ローは遺伝子発現である。いずれにしてもうまくいくようですが、行/列に何が含まれるべきかについてコンセンサスがありますか?ありがとう!PCAはRNAのためのprcompを使用しているR

+1

実際、それは数学的に言えば「どちらの方法でも動作します」。しかし、ほとんどのデータ分析では、列には関心のある変数(ケースの場合は遺伝子)が含まれ、行にはそれらの変数(ケースのサンプル)の観測値が含まれます。 – neilfws

+0

ありがとう@neilfws!明確にするために、遺伝子をベクターとして使用して、サンプル間の関係を調べることに興味があります。まだ遺伝子は列にあるはずですか? –

答えて

0

ほとんどの生物統計学的Rパッケージは、データフレームを転置することによってこれを行います。私はあなたに証明を与えます:

RUV SVD因子分解法はRNA-Seqでよく見られます。それのソースコードを見てください:

https://github.com/drisso/RUVSeq/blob/master/R/RUVg-methods.R

if(isLog) { 
    Y <- t(x) 
} else { 
    Y <- t(log(x+epsilon)) 
} 

xは、遺伝子のマトリクス表です。転置操作が見えますか?コードの後半で、パッケージはsvd関数に転置行列(Y)を与えます。

svdWa <- svd(...) 

生命などをより簡単にするために、列やサンプルを遺伝子に入れることができます。

関連する問題