「キーワード」に基づいて新しい列に値を割り当てる必要があります。私は以下のような簡単な裁判をしました。ルールは "広告"または "マーケティング"を含むすべてのキーワードに "マーケティング"としてタグを付ける必要があります。テキストカテゴリに基づいて条件付きで列に値を割り当てるR
keyword <- c("advertising plan",
"advertising budget",
"marketing plan",
"marketing budget",
"hr plan",
"hr budget",
"operation plan",
"operation budget")
indicator <- c(1,0,0,1,1,1,0,1)
sample <- cbind(keyword,indicator)
私はこの方法を使用してタグ付けを行いました。
sample$topic <- ifelse(grepl("(marketing|advertising)",sample$keyword),"Marketing",0)
しかし、今、私は以下のような別の文字列の要因として保存されている長いルール、持っている:ルールに前のコードで一つ一つを入力するのは難しいです
rule <- c("marketing", "advertising", "word 3", "word 4" .... "word 500")
を。私はRですべてのルールを一緒に実行する方法があるのだろうか、これを行うためのループを書くべきかと思う。
使用' paste'に
pattern
のための区切り文字|
で単一の文字列にvector
を折りたたむことができます(ペースト(ルール、崩壊= "|")、sample $ keyword)) ' – akrun