2010-12-06 9 views
0
の選択をベースに/決定

私はこのような何かに似て重複行の数を持ってdata.frame、持っている:今優先行

con <- textConnection(Lines <- " 
First, Last, Address, Address 2, Email, Custom1, Custom2, Custom3 
A, B, C, D, [email protected],1,2,3 
A, B, C, D, [email protected],1,2,2 
A, B, C, D, [email protected],1,2,1 
") 
x <- read.csv(con) 
close(con) 

を、ときに私デ・重複し、次のように:

x <- x[!duplicated(x[,c("email")]),] 

Custom3 = 1を含む行の優先順位付け方法をお勧めしますか?あるいは重複排除のためのより良い仕組みがありますか?

答えて

1

重複を見つける前にソートしてみてください。

X < - X [順序(X [、C( "カスタム3")])、]
X < - X [重複(X [、C(」!電子メール ")])])]

+0

良い提案、私は並べ替え順序についても考えていませんでしたが、それは間違いなく理にかなっています。 –

+0

Custom3 == 2に優先順位をつけたいのであれば、私の提案はうまくいかないかもしれませんが、その場合はおそらくコード冗長性が1つのライナーより優れています。ですから私のソリューションは普遍的なものではなく、むしろクエリに特有のものです。 –