文字列に非ローマ字/英語以外の文字(例:がいません)が含まれているかどうかを判断する方法を教えてください。文字列に非ローマ字が含まれているかどうかを確認する方法
2
A
答えて
4
文字列がiconv
とgrep
# My example, because you didn't add your data
characters <- c("ないでさ, satisfação, катынь, Work, Awareness, Potential, für")
# First you convert string to vector of words
characters.unlist <- unlist(strsplit(characters, split=", "))
# Then find indices of words with non-ASCII characters using ICONV
characters.non.ASCII <- grep("characters.unlist", iconv(characters.unlist, "latin1", "ASCII", sub="characters.unlist"))
# subset original vector of words to exclude words with non-ASCII characters
data <- characters.unlist[-characters.non.ASCII]
# convert vector back to a string
dat.1 <- paste(data, collapse = ", ")
# Now if you run
characters.non.ASCII
[1] 1 2 3 7
と非ラテン/非ASCII文字が含まれているかどうかを判断することができたの私の場合1,2,3、および7は、"には対応していません。
また、あなたの質問は、サイトのガイドラインにうまく適合しない
dat.1 #and the output will be all ASCII charaters
[1] "Work, Awareness, Potential"
5
あなたは、印刷可能なASCII文字の範囲外の文字の進値をチェックする正規表現/はgrepを使用することができます。
x <- 'ないでさ'
grep("[^\x20-\x7F]",x)
#[1] 1
grep("[^\x20-\x7F]","Normal text")
#integer(0)
あなたは非印刷(「コントロール」)を許可したい場合は、文字を検討します"English"では、最初の引数hteの文字クラスの範囲をgrep
に拡張し、 "\ x01"で始めることができます。文字クラスのargumetsの使用の詳細については、?regex
を参照してください。文字をUnicode、16進または8進数値で指定する方法の詳細については、?Quotes
を参照してください。
R.ooパッケージは有用である可能性があるの変換機能を持っています。
library(R.oo)
?intToChar
?charToInt
ヘンリクBengtssonのは、彼のパッケージにこれらを含めるようにフィット見ているという事実は、これを行うための便利なメソッドがあることを私に言っていませんベース/デフォルトRで。彼は長年の使用R/guRuです。他の回答を見て
はストレートフォワードと思われるこの努力を促した:
> is.na(iconv(c(x, "OrdinaryASCII") , "", "ASCII"))
[1] TRUE FALSE
関連する問題
- 1. 文字列に列に文字列が含まれているかどうかを確認する方法MySQL
- 2. 文字列に文字列が含まれているかどうかを確認してキャンセルしますか?
- 3. 文字列に数字記号が含まれているかどうかを確認する方法
- 4. 文字列にコンマが含まれているかどうか確認する
- 5. 文字列が文字列に含まれているかどうかを確認しますか?
- 6. 文字列に文字/数字が含まれているかどうかを確認する
- 7. 文字列にPHPの他の文字列が含まれているかどうかを確認する
- 8. 文字列に文字列が含まれているかどうかを確認する
- 9. 文字列に(文字列の)リストの要素が含まれているかどうかを確認する
- 10. 文字列にintが含まれているかどうかを確認
- 11. 値が文字列の配列に含まれているかどうかを確認する方法
- 12. 文字列に特殊文字が含まれているかどうかを確認するには?
- 13. 文字列xに文字 "G"が含まれているかどうかを確認するメソッドを書く
- 14. 文字列に何かが含まれているかどうかを確認する方法QWERY/1234
- 15. 文字列に大文字が含まれているかどうかを確認してください。
- 16. 文字列に開始時にhttp://が含まれているかどうかを確認する方法
- 17. TextViewに特定の文字列が含まれているかどうかを確認する方法
- 18. 文字列に特定の形式が含まれているかどうかを確認する方法
- 19. 文字列に角括弧が含まれているかどうかを確認する方法
- 20. 単語のリストに文字列が含まれているかどうかを確認する方法
- 21. 文字列に特定の単語が含まれているかどうかを確認する方法
- 22. テキストにURL文字列が含まれているかどうかを確認する方法
- 23. 文字列にコンマが含まれているかどうかを確認する方法?
- 24. 文字列にpowershellの数値が含まれているかどうかを確認する方法
- 25. 文字列が特定のパターンに含まれているかどうかを確認する方法は?
- 26. 角4 - observableに文字列が含まれているかどうかを確認する方法
- 27. dict値に単語/文字列が含まれているかどうかを確認する方法は?
- 28. 文字列にcharが含まれているかどうかを確認する方法?
- 29. RxJS ObservableにAngular2の文字列が含まれているかどうかを確認する方法は?
- 30. 文字列がリスト内のリストに含まれているかどうかを確認する方法
を実行することができます。あなたが何かをする方法を尋ねるように、そしてもっと重要なことに、これまでに試したことを見せるように言い換えてください。それが立てば、問題はかなり広く、「ツールを探しています」。 –
私はdownvoteを理解していません。完全に合理的な質問のように見えますが、すぐには検索で見つからないものです。私はいつもchar-to-integer関数を見つけるのが難しいです。私はchar2Int、charToInt、chr2Int、または何でも...それが誰でもないので、私は決して覚えていない。 –