文字のベクトルからストップワードを削除しようとしています。しかし、私が直面している問題は、 "king kond"という言葉があることです。 "king"はストップワードの1つで、 "kong kong"の "king"は削除されています。tmがダブルワードからストップワードを削除しないようにします。
ダブルワードが削除されないようにする手段はありますか? 私のコードは次のとおりです。
text <- VCorpus(VectorSource(newmnt1$form))
#(newmnt1$form is chr [1:4] "king kong lives" "foot" "island" "skull")
#Normal standardization of text.
text <- tm_map(text, content_transformer(tolower))
text <- tm_map(text, removeWords, custom_stopwords)
text <- tm_map(text, stripWhitespace)
newmnt2 <- text[[1]]$content