2016-05-24 12 views

答えて

0

一つの方法は、次のようにquantedaパッケージからdfm機能を使用することである答えを得るために、このコードを編集する方法bigrame

trigramTokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 1, max = 3)) 

なしunigrameとトライグラムを取得する必要があります

library(quanteda) 
dfm('I only want uni and trigrams', ngrams = c(1,3), verbose = FALSE) 

#Document-feature matrix of: 1 document, 10 features. 
#1 x 10 sparse Matrix of class "dfmSparse" 
#  features 
#docs i only want uni and trigrams i_only_want only_want_uni want_uni_and uni_and_trigrams 
# text1 1 1 1 1 1  1   1    1   1    1 
関連する問題