私は、特定の製品を識別するためにビルドした "キーワード"のリストを実行する必要がある複数の調達データベースを持っています。製品を外科的カテゴリーに分類する。R部分文字列一致と戻り値(R)
ここは例です。
調達データベース(実際には、私はオーバー行くことは2,000,000行以上のものを持っている):キーワードおよび戻り値の
d<-data.frame(prod_desc=c("BANDELETTE TVTO-OBTRYX HALO", "BANDELETTE MINI ARC PRECISES", "BANDELETTE D'ANALYSE POUR GLYCEMIE", "DIACH. BANDELETTE STER 19MM X 72MM","SLING MALE SYSTEM","DIACHILON","AIGUILLE","GANT","LABEL","CRAYON"),label=1:10)
一覧(はるかに長く、実際のリスト):
kw<-data.frame(kw=c("bandelette","tvt","bande transvaginale","sling system","argus"),category="ss_bandelette")
私は希望キーワードkw
が含まれている商品prod_desc
が見つかりました。一致するものがある場合はd
データフレームにkw
に関連付けられたcategory
を返す列を追加したいと思いますkw
データフレーム。
d$match <- ifelse(d$cat <- grepl(paste(kw$kw,collapse="|"), d$name,ignore.case = TRUE) == "TRUE","SS_Bandelette","-")
をしかし、私は約30の異なるカテゴリにマッピングされている約350のキーワードを持っているので、このコードは実際には効率的ではありません。キーワードの1つがトリガーされた場合、d
データフレーム内でカテゴリを自動的に返すためにどのようなコードを使用できますか?
ありがとうございました。私はこの質問を推測@DarshanBaral
フィル
は異なっています。私も以前と同じように思った。私は答えを投稿しました –