私は、各個人(行)が変数ごとに2つのデータポイントを持つデータフレームを持っています。変数の2列にIDを割り当てます
例データ:
df1 <- read.table(text = "IID L1.1 L1.2 L2.1 L2.2
1 1 38V1 38V1 48V1 52V1
2 2 36V1 38V2 50V1 48Y1
3 3 37Y1 36V1 50V2 48V1
4 4 38V2 36V2 52V1 50V2",
stringsAsFactor = FALSE, header = TRUE)
私は完全なデータセットで、これよりもさらに多くの列を持っており、2列にわたって一意の識別子をラベル付けするために、これらの値を再コーディングしたいと思います。私は識別子を取得し、以前の質問(Creating a unique IDとHow to assign a unique ID number to each group of identical values in a column)から単一列を再ラベル付けする方法を知っていますが、Rが列ごとに要素を識別してラベル付けするので、2つの列の情報を含める方法はわかりません。
最終的に私は、上記のデータのために、このようになります何かをしたい:
(df2)
IID L1.1 L1.2 L2.1 L2.2
1 1 1 1 1 4
2 2 2 4 2 5
3 3 3 2 3 1
4 4 1 5 4 3
本当に限り、彼らは両方の列で一意の値を示すように、数字が何であるかは重要ではありません。私はからの出力に基づいて機能を作成しようとしました:
unique(df1[,1:2])
が、これはまだない2間で、列ごとに一意のエントリを見て苦労しています。
こんにちは!私がdfを行列に変換すると、これは私のために働いた。このコードでは、NAを可能な一意の識別子の1つに変換するため、データにNAに関する問題が発生しています。どうやってそれを説明できるか知っていますか? 編集:割り当てられた番号はそれほど問題にはならないので、後でNAに切り替えてください。 ありがとうございます! –
また、 'refs