非常に新しいので、tidytextパッケージを使用し始めました。R Tidytextとunnest_tokensのエラー
unnest_tokens
関数に引数を渡して、複数の列分析を行うことができます。だからではなく、この
library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)
original_books <- austen_books() %>%
group_by(book) %>%
mutate(linenumber = row_number(),
chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
ignore_case = TRUE)))) %>%
ungroup()
original_books
tidy_books <- original_books %>%
unnest_tokens(word, text)
のコードの最後の行は次のようになります。
output<- 'word'
input<- 'text'
tidy_books <- original_books %>%
unnest_tokens(output, input)
しかし、私は、この取得しています:check_inputで
エラー(X): 入力がなければなりませんが任意の長さの文字ベクトルまたは文字のリスト ベクトルの長さはそれぞれ1である。
私は多くの運が無くas.character()
を使ってみました。
これがどのように機能するかについてのご意見はありますか?
@ 42「austen_books」は、githubのパッケージ内の関数です。https://github.com/juliasilge/janeaustenr/blob/master/R/austen_books.R - 私は驚いています... –
@CyrusMohammadianまた、CRANの上に:https://cran.r-project.org/web/packages/janeaustenr/index.html –