私は、遺伝子シンボル用と機能パスウェイ用の2つの列を持つデータフレームを持っています。各経路に属する多数の遺伝子があるので、経路列は反復された値を有する。各列が単一の経路であり、それらの列の各行がその経路に属する遺伝子であるように、このデータセットの順序を変更したいと思います。リピートを使用してデータフレームを転置する
開始データフレーム:
data.frame(pathway = c("p1", "p1", "p1", "p1", "p2", "p2", "p2"),
gene.symbol = c("G1", "G2", "G3", "G4", "G33", "G43", "G10"))
理想のデータフレーム:
data.frame(p1 = c("G1", "G2", "G3", "G4"), p2 = c("G33", "G43", "G10",
""))
私がいないすべての列が同じ長さになることを知っているし、ブランク値を持つことがNASに好適です。
列が同じ長さを持っていないので、あなたが作成オフに本当に優れています'data.frame'ではなく、標準的な' list'です。特に行1、列1は行1、列2とは何の関係もありません。 –