優先行

の選択をベースに/決定

私はこのような何かに似て重複行の数を持ってdata.frame、持っている：今優先行

con <- textConnection(Lines <- " 
First, Last, Address, Address 2, Email, Custom1, Custom2, Custom3 
A, B, C, D, [email protected],1,2,3 
A, B, C, D, [email protected],1,2,2 
A, B, C, D, [email protected],1,2,1 
") 
x <- read.csv(con) 
close(con)

を、ときに私デ・重複し、次のように：

x <- x[!duplicated(x[,c("email")]),]

Custom3 = 1を含む行の優先順位付け方法をお勧めしますか？あるいは重複排除のためのより良い仕組みがありますか？

出典

2010-12-06 Brandon Bertelsen

重複を見つける前にソートしてみてください。

X < - X [順序（X [、C（ "カスタム3"）]）、]
X < - X [重複（X [、C（」！電子メール "）]）]）]

出典

2010-12-07 00:05:07

良い提案、私は並べ替え順序についても考えていませんでしたが、それは間違いなく理にかなっています。 –

Custom3 == 2に優先順位をつけたいのであれば、私の提案はうまくいかないかもしれませんが、その場合はおそらくコード冗長性が1つのライナーより優れています。ですから私のソリューションは普遍的なものではなく、むしろクエリに特有のものです。 –

答えて

関連する問題