1
Rのテキストマイニングに取り組んでいますが、句読点、数字、URL、ストップワードを削除した後で、私のコーパスの文書はほとんどありません。その後Stemcompletion in R
myStopwords <- setdiff(myStopwords, c("r", "big"))
myCorpus <- tm_map(myCorpus, removeWords, myStopwords)
myCorpus <- tm_map(myCorpus, stripWhitespace)
myCorpusCopy <- myCorpus
for (i in c(1:2, 320))
{
cat(paste0("[", i, "] "))
writeLines(strwrap(as.character(myCorpus[[i]]), 60))
}
[1] examples calling java code r
[2] simulating mapreduce r big data analysis using flights data
rbloggers
[320] r reference card data mining now cran lists many useful r
functions packages data mining applications
、私はfor
ループを実行しようとすると
myCorpus <- tm_map(myCorpus, stemDocument)
myCorpus <- tm_map(myCorpus, stemCompletion, dictionary=myCorpusCopy)
が、それは
for (i in c(1:2, 320))
{
cat(paste0("[", i, "] "))
writeLines(strwrap(as.character(myCorpus[[i]]), 60))
}
[1] NA
[2] NA
[320] NA
任意のアイデア以下のように、NA
を示しており、以下のように語幹のためにしようとしています私はここで間違っていますか?