こんにちは私はtidy_text形式で作業しています。文字列 "emails"と "emailing"を "email"に置き換えようとしています。整頓されたテキストフォーマット内のWord置換
set.seed(123)
terms <- c("emails are nice", "emailing is fun", "computer freaks", "broken modem")
df <- data.frame(sentence = sample(terms, 100, replace = TRUE))
df
str(df)
df$sentence <- as.character(df$sentence)
tidy_df <- df %>%
unnest_tokens(word, sentence)
tidy_df %>%
count(word, sort = TRUE) %>%
filter(n > 20) %>%
mutate(word = reorder(word, n)) %>%
ggplot(aes(word, n)) +
geom_col() +
xlab(NULL) +
coord_flip()
これは正常に動作しますが、私は使用している場合:
tidy_df <- gsub("emailing", "email", tidy_df)
言葉に置き換えて、再び棒グラフを実行するために、私は次のエラーメッセージが出ます:UseMethodで
エラー(「group_by_を」 ): 'group_by_'の適用可能なメソッドは、「文字」クラスのオブジェクトに適用されません。
整頓されたテキスト内で簡単に単語を置換する方法を知っている人はいますかtidy_textの構造/クラスを変更することなくフォーマットできますか?
ニース、stringrパッケージがうまく機能し、私はstr_replaceを使用する場合にのみ、私は1行(代わりに、私は2つのステップでそれをやった)で、いくつかのビットを行うことができませんでした:変異させる(ワード= str_replace(ワード、 "coff(e | eee)"、 "coffee"))。それは "e"と "eee"が同じ文字で始まるからですか? –