1
多くの重複したデータフレームを特定のエントリごとに1回だけデータフレームに縮小しようとしていますが、この変数がデータフレーム内でどのくらいの頻度で発生するか。今私はkh$gem[124]
がデータフレームであるか、多くの場合、正規表現でいくつかのトラブル..regexpでパターンをより正確に指定する方法
length(grep(kh$gem[124],kh$gem))
カウントを持っています。問題は、その
> kh$gem[124]
[1] "Salzburg"
と
> grep(kh$gem[124],kh$gem)
[1] 120 124 125 126 127 128 134 141 144 146 148
ですが、私はこれらの変数に見ればそこにいくつかのIどの確かに「マッチ」正規表現がありますが、まさに私が探していたものではありません。
> kh$gem[c(120,124,125,126,127,128,134,141,144,146,148)]
[1] "Oberndorf bei Salzburg" "Salzburg" "Salzburg" "Salzburg"
[5] "Salzburg" "Salzburg" "Salzburg" "Salzburg"
[9] "Salzburg" "Oberndorf bei Salzburg" "Salzburg"
"Oberndorf bei Salzburg"はどうすれば削除できますか?
ありがとうございました。宜しくお願いします!
'sum(kh $ gem%in%kh $ gem [124])? – Cath