私はこれについてどうやって行くのかかなり混乱しています。データフレームに2つの列があるとします。 1つの列は数値順(x)、もう一方は最初の数値か-1(y)を指定します。これらは、一致する実験の結果です。目標は、同じ個人の写真が複数あるかどうかを確認することです。下の例では10枚の写真がありますが、6枚は独特の写真です。 y列には、一致するものがあれば対応するxが報告されます。マッチしない場合、yは-1です(同様にNAsかもしれません)。 1人あたり2枚以上の写真がある場合、マッチ#は最新の記録になります(写真1,5,7は同じ個人です)。グループは写真が撮影された時間です(グループ内で一致するものはありません)。うまくいけば、私は右のこの例を持っている:2つの列を比較する:論理値は列2の列1の値ですか?
x <- c(1,2,3,4,5,6,7,8,9,10)
y <- c(-1,-1,-1,-1,1,-1,1,-1,2,4)
group <- c(1,1,1,2,2,2,3,3,3,3)
DF <- data.frame(x,y,group)
私はユニークな個人に名前を付けるために、新しい変数を作成し、個々ごとに単一の行で、最終的なデータセットを持っていると思います(つまり、唯一の6行の代わりに10を持っています)、グループ情報も含まれています。私。個人が3つすべてのグループに属している場合、「111」の値が存在する可能性があります。または、最初のグループと最後のグループの場合は「101」になります。任意のヒント?
結果のデータセットについて質問してくれてありがとう。私が与えた実際の数字に基づいてグループの説明が悪いことに気がついたので、結果を少し変更しました。ボーナスも持っているといいですが、重要ではありません。
name <- c(1,2,3,4,6,8)
group_history <- as.character(c('111','101','100','011','010','001'))
bonus <- as.character(c('1,5,7','2,9','3','4,10','6','8'))
results_I_want <- data.frame(name,group_history,bonus)
私の言葉、上記固定よりミス...
のための別の解決策は、あなたがデータセットは、この例のためにどのように見えるかを追加してもらえますか? –