私は私の「メイン」data.frame
10の列および行の数千を持っている4つの異なる細胞マーカー マッチ組み合わせが
combinations_df
FITC Cy3 TX_RED Cy5
a 0 0 0 0
b 1 0 0 0
c 0 1 0 0
d 1 1 0 0
e 0 0 1 0
f 1 0 1 0
g 0 1 1 0
h 1 1 1 0
i 0 0 0 1
j 1 0 0 1
k 0 1 0 1
l 1 1 0 1
m 0 0 1 1
n 1 0 1 1
o 0 1 1 1
p 1 1 1 1
の
data.frame
16との異なる組み合わせを有します。
> main_df
a b FITC d Cy3 f TX_RED h Cy5 j
1 0 1 1 1 1 0 1 1 1 1
2 0 1 0 1 1 0 1 0 1 1
3 1 1 0 0 0 1 1 0 0 0
4 0 1 1 1 1 0 1 1 1 1
5 0 0 0 0 0 0 0 0 0 0
....
Iは、main_df
の各行と比較するcombinations_df
からすべての可能な16個の組み合わせを使用します。それから私は、カラム11
サンプル出力
> phenotype
[1] "g" "i" "a" "p" "g"
私は各main_df
行を通じて各combinations_df
行をチェックするforループ内whileループをやって考えたとしてmain_df
からcbind
後でに新しいvector
を作成したいです。
それはうまくいくような音ですが、main_df
には1 000 000行近くありますので、誰かがより良いアイデアを持っているかどうかを見たいと思っていました。
編集:私はcombinations_df
を列3,5,7,9と比較することを忘れていました。main_df
からです。彼らは同じ名前を持っていますが、明らかではないかもしれません。
EDIT:
各dfの4つのセルマーカー列を連結してから、新しい連結列を使用してマッチまたはマージを行うとどうなりますか – emilliman5
私はあなたを@ emilliman5に追いかけているとは確信していません。私は比較的新しくR – jesusgarciab