私はツイートの感情分析をしようとしています。言葉の前処理を行うと、行列を作成している間、私は次のエラーだ:14215件のツイートからrのステミングワード:値がありません
Error in if (any(lens > lim)) stop("There is a limit of ", lim, "characters on the number of characters in a word being stemmed") :
missing value where TRUE/FALSE needed
を、私は、エラーが発生した特定のつぶやきにそれを煮詰めが、どのように何の手掛かりを持っていませんこのエラーが再び発生しないようにしてください。 エラーが発生したため、先のつぶやきれ(およびエラーを再現するコード):
library(RTextTools)
tweet<-"demonio leg edge sexy we get it u vape PLEASE COME TO NA SOON I HAVE A LUCIEL READY FOR U dominos"
all_tweets= create_matrix(tweet, language="english", minWordLength = 3,
removeStopwords=TRUE, removeNumbers=TRUE, # we can also removeSparseTerms
stemWords=TRUE,removePunctuation = TRUE,removeSparseTerms = 0)
私は、最初のエラーを理解したいと思います - 私が望むことに私を可能にする方法であり、その後発生し、なぜそのようなつぶやきを選択したり削除したり、create_matrix関数をこのように編集したりすることで、このエラーが発生しないようにします。
を。ここでは、Windows 64、R 3.2.2、RTextTools 1.4.2では、入力したテキストにエラーが再現できません。 –
私はRバージョン3.3.0とRTextTools 1.4.2 – user3109578
を使用していましたが、おそらくロケールまたはエンコーディングの問題です。 @lukeAの提案も可能です。とにかく、あなたのコードがここでの魅力のように働くことは間違いありません。 –