2016-12-22 41 views
1

私はそれに固執していますので、助言を歓迎します。文字列のベクトルからASCII文字を含む単語のみを抽出する

b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE)) 

リストを返します:

List of 2 
$ : chr [1:2] "hello" "ring" 
$ : chr "trust" 

しかし、私は、このような"hello ring", "trust"などのベクターc('hello ringпрг','trust')の各要素については、この言葉の文字列のベクトルを持っていると思います。他の機能やパッケージも歓迎します。

+1

は辞書なしで英語の単語を抽出する方法はありません。あなたが実際にASCII文字を抽出したいのであれば... – Roland

+0

@Rolandあなたは正しいです、タイトルが編集されました – Shin

答えて

2

として使用sapplyをパターンを使用することができます。

b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE)) 

sapply(b, paste, collapse = " ") 

## [1] "hello ring" "trust" 
2

我々は

unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE))) 
#[1] "hello ring" "trust" 

を使用するかのようにpaste"[[:ascii:]]+"