私はRが新しくなったので、私を許してください。私はこの質問をどのようにするかわからない...この質問の目的は、どの2つまたは3つの要因が最も共有されているかを理解することです。 私はこのようなデータフレームを有する:データフレーム内の無作為に選択された2つの列の合計共有値を取得する方法
mydata<-read.table(header=TRUE, text="
A B C D
peak_1 peak_1 0 0
peak_2 0 0 peak_2
0 0 peak_3 peak_3
peak_4 0 0 peak_4
peak_6 0 0 0
peak_7 0 peak_7 0
peak_8 peak_8 peak_8 peak_8")
A、B、C及びDは、4つの要因です。うまくいけば、このテーブルはあなたのRにうまく表示できます。 2つの列の間に共有される値の数(0ではなく)を求めたいと思います。私は、その結果を以下のように表示されます期待している:
myresuts<-read.table(header=TRUE, text = "
factor_1 factor_2 number_of_shared
A B 2
A C 2
A D 3
B C 1
B D 1
C D 2")
この小さなテーブルのために、私は手動で交差点を行うことができます。しかし、実際には、このような計算を行うために100列以上の非常に大きなテーブルがあります。私はこの問題を解決する関数を書く方法を知っています。 また、3つの列ごとに共有値の合計を計算したい場合(これは同じ方法で解決できますように)
ありがとうございます!
まあは、最終的には私の質問にコードを配置する方法を見つけ出す... – Badgerliu