0
私は文字列を含むデータセットを持っており、以下のような特殊文字がデータセットにあります。Rプログラミング - データセットから特殊文字を削除するにはどうすればいいですか?
どのように私は自分のデータセットから上記のような特殊文字を削除しますか?
私は文字列を含むデータセットを持っており、以下のような特殊文字がデータセットにあります。Rプログラミング - データセットから特殊文字を削除するにはどうすればいいですか?
どのように私は自分のデータセットから上記のような特殊文字を削除しますか?
使用正規表現、たとえば、不要な文字を削除するには:
dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE)
をワード文字とスペース以外のすべてを削除します。より複雑な置換えを行うには、ヘルプトピック?regexp
を参照してください。
また、エンコーディング(Encoding
とiconv
は参考になります)を参照してください。テキストは正しくても間違ったエンコーディングが仮定されています。