私はrでtmパッケージを使用しています。私はstemCompletionを含めるまで、すべて正常に動作します。 tm_map(c, stemCompletion, c)
引数x
のにPlainTextDocument
を渡すので、理論的には、おそらくtm_map(c, content_transformer(stemCompletion), c)
を使用したいと思い、rtmパッケージを使用したstemCompletionエラー
path = '~/Interviews/Transcripts/'
file.names <- dir(path, pattern = '.txt')
corpus = lapply(seq_along(file.names), function(index) {
fileName = file.names[index]
filePath = paste(path, fileName, sep = '')
transcript = readChar(filePath, file.info(filePath)$size)
transcript <- gsub("[’‘^]", '', transcript)
corpusName = paste('transcript', index, sep = "_")
c <- Corpus(VectorSource(transcript))
DublinCore(c[[1]], 'Identifier') <- paste(index, fileName, sep ='_')
meta(c, type = 'corpus')
c <- tm_map(c, stripWhitespace)
c <- tm_map(c, content_transformer(tolower))
c <- tm_map(c, removeWords, c(stopwords("english"), 'yeah', 'yep'))
c <- tm_map(c, removePunctuation)
c <- tm_map(c, stemDocument)
c <- tm_map(c, stemCompletion, c)
c <- tm_map(c, PlainTextDocument)
c
})
これは再現できません。これを掘り下げる誰かを見つけることを幸運。良い例を作る方法について[ここにいくつかの秘訣があります](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。 –
'stemCompletion'は何をすると思いますか? – lukeA