文字列のベクトルからASCII文字を含む単語のみを抽出する

b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

リストを返します：

List of 2 
$ : chr [1:2] "hello" "ring" 
$ : chr "trust"

しかし、私は、このような"hello ring", "trust"などのベクターc('hello ringпрг','trust')の各要素については、この言葉の文字列のベクトルを持っていると思います。他の機能やパッケージも歓迎します。

2016-12-22 Shin

は辞書なしで英語の単語を抽出する方法はありません。あなたが実際にASCII文字を抽出したいのであれば... – Roland

@Rolandあなたは正しいです、タイトルが編集されました – Shin

として使用sapplyをパターンを使用することができます。

b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE)) 

sapply(b, paste, collapse = " ") 

## [1] "hello ring" "trust"

2016-12-22 06:11:49

我々は

unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE))) 
#[1] "hello ring" "trust"

を使用するかのようにpasteで"[[:ascii:]]+"

2016-12-22 06:09:52 akrun

答えて