1
以下のMWEを参照してください。カスタム定義されたトークナイザは動作しません。なぜですか?tmパッケージのカスタムトークナイザが動作しない
01あなたは corpDS < -Corpus(...) によってcorpDS < -VCorpusを交換する必要があります:規約
ドキュメントの証言この
[1] "Thの" "S"「SA:TMパッケージのバージョンは0.71
library(tm) ts <- c("This is a testimonial") corpDs <- Corpus(VectorSource(ts)) #This is not working ownTokenizer <- function(x) unlist(strsplit(as.character(x), "i+")) tdm <- DocumentTermMatrix(corpDs,control=list(tokenize=ownTokenizer)) as.matrix(tdm) #This is working ownTokenizer(ts)
出力でありますテスト ""月 ""アル "
は、私は、これは今、やや古いですけど、多分それはまだ他の人を助け、
トビアス