2017-08-02 13 views
1

いくつかの同じ列名を持つデータが2つあり、異なる観察結果を確認したい場合はどうすればよいですか?2回のデータ重複テスト

# dt1 
ID Name ColA ColB 
2 Peter 1  2 
4 Freda 50  4 
5 Jean 8  10 

# dt2 
ID Name ColA ColB ColC ColD 
1 Roger 1  2  400 
2 Peter 1  2  500 2000 
3 Tina 3  50   20 
4 Freda 50  4  500 300 
5 Jean 8  10 89  54 

ColAColBColC、およびColDが重要でない:

は、ここに私のサンプルデータです。私はちょうどIDNameをチェックしたいです。

第2に、dt1と同じでないdt2をチェックします。
したがって、結果は次のとおりです。

ID Name ColA ColB ColC ColD 
1 Roger 1  2  400 
3 Tina 3  50   20 

私の実際のデータが非常に大きいので、私はどのように確認できますか?

+2

あなたはちょうどIDと名前で反結合をしたいですか?その場合は、[this](https://stackoverflow.com/questions/28702960/find-complement-of-a-data-frame-anti-join)を参照してください。 –

答えて

3
> library(dplyr) 
> anti_join(dt2,dt1,by=c('ID','Name'))