R：ある文字列内の単語を別の文字列で検索し、一致しなかった単語を返します。

私のデータテーブルには2つのテキスト列（col1とcol2）があります。どちらにも文章があります。 col1にあるすべての単語をcol2で検索し、col1の単語から、col2にある単語を差し引いた文字列を返したいとします。以下は例ですR：ある文字列内の単語を別の文字列で検索し、一致しなかった単語を返します。

  col1     |   col2    |  output 
america, uk have too much money | uk, uk money too too | america, have much

出典

2017-05-25 Oshan

いえないコンマ？ – Jan

このようなものはありますか？

DT <- data.table(col1 <- "america, uk have too much money", col2 <- "uk, uk money too too") 
DT[, output := paste(strsplit(DT[,col1], "(\\s+)|(?!')(?=[[:punct:]])", perl = TRUE)[[1]][!(strsplit(DT[,col1],"(\\s+)|(?!')(?=[[:punct:]])", perl = TRUE)[[1]] %in% strsplit(DT[,col2], "(\\s+)|(?!')(?=[[:punct:]])", perl = TRUE)[[1]])], collapse = " ")]

あなたがこれまでに試してみました何

出典

2017-05-25 12:51:10 simone

[これを参照]（https://stackoverflow.com/questions/22235288/strsplit-on-all-spaces-and-punctuation-except-apostrophes） – simone

ありがとう@サイモン.. – Oshan

R：ある文字列内の単語を別の文字列で検索し、一致しなかった単語を返します。

答えて

関連する問題