1
私は1億行のデータセットを持っていますが、そのうち約10個はUnicode置換文字を持っています。この特定の文字のテキスト表現は "< U + FFFD>"(空白を削除)ですが、他にもあります。r - 文字列からUnicode置換文字を削除します。
私はキャラクターを削除したいと思いますが、私はそれを行う方法を考え出すことができませんでした。
str <- "торгово производственн��я компания"
gsub("<U+FFFD>", "", str)
"торгово производственн��я компания"
追加情報を提供する必要がある場合は、お知らせください。また、ここで正確に何が起こっているのかについての説明には非常に感謝します。(通常のgsubが機能しない理由とそのように表示される理由)
を' –
@WiktorStribiżewありがとう、それは完璧に働いた – Alexvonrass