2017-05-31 8 views
1

ここで初心者です。私はこれが簡単で前に答えられていると確信していますが、私は今、答えを探していて1時間以上過ぎていて、それを見つけることができませんでした。私はstatement_type_cd観測GSXXXXさXに任意の番号と一致statement_text観測を抽出したいサブセットデータフレーム(係数変数別)

> str(statement) 
'data.frame': 16464206 obs. of 3 variables: 
$ statement_type_cd: Factor w/ 428 levels "A00001","A00002"... 
$ statement_text : Factor w/ 9894526 levels... 
$ serial_no  : int 60146682 60149828 70011210... 

は、私は3つの変数を持つデータフレームを持っています。

つまり、statement_type_cd変数のGSで始まる任意の観測によって、データフレームをサブセット化するにはどうすればよいですか。

感謝:)

+0

会社e 'substr'を実行して最初の2文字を抽出し、それらが" GS "に等しいかどうかをチェックします。 –

答えて

1

私たちは、文字列の先頭(^)からパターン「GS」を照合することによって論理ベクトルを作成し、subsetにそれを使用するgreplを使用することができ、データセット

statementsub <- subset(statement, grepl("^GS", statement_type_cd)) 

かとtidyverse

library(dplyr) 
statementsub <- statement %>% 
        filter(grepl("^GS", statement_type_cd)) 
+0

お返事ありがとうございますakrun!それは完璧に働いた!私があなたの答えを見たときに面白かった、私は[正規表現](https://stat.ethz.ch/R-manual/R-devel/library/base/html/regex.html)について読んでいました:) – Hoju