うまくいけば、これはかなり単純な質問です。私は、作業中のデータの一部をサブセット化するためにRを使用しています。私が現在取り組んでいるデータのうち、print()
があります。 JobCode
に基づいてデータのsubset()
を作成しようとしています。あなたが見ることができるように、JobCodeは特定の業界で最初の2つの数字が同じパターン(00 - 0000)に従います。パターンに従う値のサブセット
ID State StateName JobCode
1 AL Alabama 51-9199
2 AL Alabama 27-3011
4 AL Alabama 49-9043
5 AL Alabama 49-2097
私の現在の試行が使用するこのtest <- subset(data, data$State == "AL" & data$JobCode == ("15-####"))
「15-」で始まるJOBCODEためサブセットに(#は、残りの4つの値のプレースホルダです)。残りの4つの値を探すようにサブセットに指示する方法はありますか?
私はStackOverflowを初めて使用しているため、フォーマットが貧弱だと申し訳なく思っています。私もRには慣れていません。ご協力いただきありがとうございます。
を、正規表現は、(Rまたは何か他のものを使用しているかどうか)それを扱うことができます。 Rのドキュメントのコンソールに '?regex'と入力してください。あるいは、開始が常に固定幅であれば、 '?substring'を見ることができます。 – Frank
@Frankトピックに関する私の知識を大いに助けてくれた '?正規表現 'に向かって私を指摘してくれてありがとう。私はまだRのすべての構文ニュアンスを学んでいます。 – pc8807