2017-11-27 7 views
0

キャレットパッケージ[R]でモデルを実装したいいる:https://cran.r-project.org/web/packages/text2vec/vignettes/text-vectorization.html#tf-idf私はTF-IDF行われ、私は、このリンクで説明されTF-IDFアルゴリズム実装した

ので、分類器はこのように実装された:

xとyの
glmnet_classifier = cv.glmnet(x = dtm_train_tfidf, y = train[['sentiment']], 
           family = 'binomial', 
           alpha = 1, 
           type.measure = "auc", 
           nfolds = NFOLDS, 
           thresh = 1e-3, 
           maxit = 1e3) 

タイプは次のとおりです。私は「キャレット」のパッケージには、たとえば、異なるclassiferを使用するにはどうすればよい

> typeof(dtm_train_tfidf) 
[1] "S4" 
> typeof(train$setiment) 
[1] "integer" 

がお書きになります。

model_svm<-train(x = dtm_train_tfidf, y = train[['sentiment']],method='svmRadial') 

問題はこれが機能しないということです。 キャレットパッケージなどでcv.glmnetではなく異なる分類子を実装する方法はありますか?この入力x、yとキャレット分類子の間には何らかの接続がありますか?もしそうでなければ、このタイプの入力を扱うことができるcv.glmnetのようなパッケージはありますか?

答えて

0

dtmは、CSC形式dgCMatrixのスパース行列です。だから、疎な行列を入力として取ることができるパッケージを探してください。または、次元削減(LSAなど)を適用してから、この稠密な行列をcaretに送ることができます。

+0

h2oパッケージでスパース行列を使用できますか? – toumperlekis

+0

できますが、私は実際にはお勧めしません。効率的に処理することはできません。 –

関連する問題