2017-05-30 16 views

答えて

3

使用正規表現、たとえば、不要な文字を削除するには:

dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE) 

をワード文字とスペース以外のすべてを削除します。より複雑な置換えを行うには、ヘルプトピック?regexpを参照してください。

また、エンコーディング(Encodingiconvは参考になります)を参照してください。テキストは正しくても間違ったエンコーディングが仮定されています。

関連する問題