ヘブライ語のテキストから英語の文字を削除していますが、英語の単語のリストを希望します。 words2keep <- c("ok", "hello", "yes*")
。 私の現在の正規表現はtext <- gsub("[A-Z,a-z]", "", text)
ですが、問題はすべての英語の単語を削除しないように例外を追加する方法です。gsub in R
reproducibe例:例外
text = "ok אני מסכים איתך"
とGSUB後
text = "ok אני מסכים איתך Yossi Cohen"
これはトリッキーなものですすべての提案を
のためにそれはあなたの答えを持っているようにhttp://stackoverflow.com/questions/2404010/match-everything-except-for-specified-strings –