重複をすべてNAでグループ化したいのですが、同時に2つの列に重複している場合のみです。 V2およびV3。グループ単位で重複(複数の列)を置き換えます。
V1 V2 V3 V4
1 a b c d
2 a c b a
2 a c b d
最終的な結果は次のようになります。
V1 V2 V3 V4
1 a b c d
2 a c b a
2 na na b d
私は、現時点では微調整しようとしている基本的なコードは次のとおりです。
df %>%
group_by(V1) %>%
mutate_each(funs(replace(., duplicated(.), NA)))
あなたが見ることができるように、このコードは正常に動作しますすべての別々の列を使用していますが、「2列に重複している場合にのみ」(たとえばmutate_each(funs(replace(., duplicated(c("V2", "V3"), NA)))
またはmutate_each(funs(replace(., duplicated(df[c("V2", "V3")], NA))))
によって、除外の条件を渡したい場合は、どこでも私を導きません)
複数の列を重複して正しく渡す方法に関する提案はありますか?
私はあなたが 'mutate_at()'をtで使うと思いますハットケース。 –
何度も試してみましたが、どちらの方法でmutate_at全体に変数を渡しても、重複しても動作しません。 mutate_atは2つの変数を同時に扱うことができないようです。 – Psych91