2016-05-07 3 views
1

Twitterデータを取得してワードクラウドを作成しようとしていますが、TermDocumentMatrixの作成中にエラーが発生しました。私のコードは以下の通りですR:TermDocumentMatrix - 作成中にエラーが発生しました

twitter_search_data <- searchTwitter(searchString = text_to_search 
            ,n = 500) 

twitter_search_text <- sapply(twitter_search_data 
          ,function(x) x$getText()) 

twitter_search_corpus <- Corpus(VectorSource(twitter_search_text)) 

twitter_search_corpus <- tm_map(twitter_search_corpus, stripWhitespace, lazy = TRUE) 

twitter_search_corpus <- tm_map(twitter_search_corpus, content_transformer(tolower), lazy = TRUE) 

twitter_search_corpus <- tm_map(twitter_search_corpus, PlainTextDocument,lazy = TRUE)  

twitter_search_corpus <- tm_map(twitter_search_corpus, removePunctuation, lazy = TRUE) 

twitter_search_corpus <- tm_map(twitter_search_corpus, removeNumbers, lazy = TRUE) 

twitter_search_corpus <- tm_map(twitter_search_corpus, removeWords, c("the", "this", "The", "This", stopwords('english')), lazy = TRUE) 

twitter_search_corpus <- tm_map(twitter_search_corpus, stemDocument, lazy = TRUE) 

# Create Document Term Matrix 
tdm <- as.matrix(TermDocumentMatrix(twitter_search_corpus 
            ,control=list(wordLengths=c(3,Inf)) 
            )) 

TermDocumentMatrixを作成する前にエラーはありません。 、ユーザーコードで 予定のコア1発生したエラー:私が手にエラーがmclapplyで

警告以下の通りである(Xの$コンテンツ[i]は、機能(D)tm_reduce(D、$怠惰$マップ)のX)ジョブのすべての値が影響を受けます mclapply(unname(content)(x))、termFreq、control)の警告: スケジューリングされたコア1でユーザコードにエラーが発生した場合、ジョブのすべての値が影響を受けます Warning:UseMethodクラス "try-error"のオブジェクトに適用される 'meta'の適用可能なメソッドがありません スタックトレース(最も内側のもの): 74:FUN
73:lapply
72:se tNames
71:as.list.VCorpus
70:as.list
69:lapply
68:meta.VCorpus
67:メタ
66:TermDocumentMatrix.VCorpus
65:TermDocumentMatrix
64: as.matrix
63:observeEventHandler
1:runApp

私はすでに追加されていますlazy = TRUEcontent_transformer(tolower)でも、まだエラーが発生しています。

答えて

0

問題がテキストに挿入された空白文字、句読点、数字や言葉を除去した後

twitter_search_corpus <- tm_map(twitter_search_corpus, stripWhitespace, lazy = TRUE) 

の配置であると思われます。したがって、上記の空白を削除するコードは、TermDocumentMatrixを作成する前に最後の文にする必要があります。

関連する問題