2016-03-21 3 views
1

多くの重複したデータフレームを特定のエントリごとに1回だけデータフレームに縮小しようとしていますが、この変数がデータフレーム内でどのくらいの頻度で発生するか。今私はkh$gem[124]がデータフレームであるか、多くの場合、正規表現でいくつかのトラブル..regexpでパターンをより正確に指定する方法

length(grep(kh$gem[124],kh$gem)) 

カウントを持っています。問題は、その

> kh$gem[124] 
[1] "Salzburg" 

> grep(kh$gem[124],kh$gem) 
    [1] 120 124 125 126 127 128 134 141 144 146 148 

ですが、私はこれらの変数に見ればそこにいくつかのIどの確かに「マッチ」正規表現がありますが、まさに私が探していたものではありません。

> kh$gem[c(120,124,125,126,127,128,134,141,144,146,148)] 
[1] "Oberndorf bei Salzburg" "Salzburg" "Salzburg" "Salzburg"    
[5] "Salzburg" "Salzburg" "Salzburg" "Salzburg"    
[9] "Salzburg" "Oberndorf bei Salzburg" "Salzburg"  

"Oberndorf bei Salzburg"はどうすれば削除できますか?

ありがとうございました。宜しくお願いします!

+0

'sum(kh $ gem%in%kh $ gem [124])? – Cath

答えて

1

アンカーを追加します。

grep(paste0("^" , kh$gem[124] , "$"),kh$gem) 
関連する問題