2016-08-30 26 views
2

非常に新しいので、tidytextパッケージを使用し始めました。R Tidytextとunnest_tokensのエラー

unnest_tokens関数に引数を渡して、複数の列分析を行うことができます。だからではなく、この

library(janeaustenr) 
library(tidytext) 
library(dplyr) 
library(stringr) 

original_books <- austen_books() %>% 
    group_by(book) %>% 
    mutate(linenumber = row_number(), 
     chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]", 
               ignore_case = TRUE)))) %>% 
    ungroup() 

original_books 

tidy_books <- original_books %>% 
       unnest_tokens(word, text) 

のコードの最後の行は次のようになります。

output<- 'word' 
input<- 'text' 

tidy_books <- original_books %>% 
       unnest_tokens(output, input) 

しかし、私は、この取得しています:check_inputで

エラー(X): 入力がなければなりませんが任意の長さの文字ベクトルまたは文字のリスト ベクトルの長さはそれぞれ1である。

私は多くの運が無くas.character()を使ってみました。

これがどのように機能するかについてのご意見はありますか?

+0

@ 42「austen_books」は、githubのパッケージ内の関数です。https://github.com/juliasilge/janeaustenr/blob/master/R/austen_books.R - 私は驚いています... –

+1

@CyrusMohammadianまた、CRANの上に:https://cran.r-project.org/web/packages/janeaustenr/index.html –

答えて

3

unnest_tokens_に下線付き

tidy_books <- original_books %>% 
       unnest_tokens_(output, input) 

を試してみてください。

unnest_tokens_は、unnest_tokensの「標準評価」バージョンであり、変数名を文字列として渡すことができます。標準と非標準の評価については、Non-standard evaluationを参照してください。

+0

ありがとう、それはトリックでした。かなり読書があるようですが、私はRのより良い取り扱いをする必要があります。 – Faye

+1

私たちは皆どこかに出発しなければなりません!がんばろう。 –

関連する問題