キャレットパッケージ[R]でモデルを実装したいいる:https://cran.r-project.org/web/packages/text2vec/vignettes/text-vectorization.html#tf-idf私はTF-IDF行われ、私は、このリンクで説明されTF-IDFアルゴリズム実装した
ので、分類器はこのように実装された:
xとyのglmnet_classifier = cv.glmnet(x = dtm_train_tfidf, y = train[['sentiment']],
family = 'binomial',
alpha = 1,
type.measure = "auc",
nfolds = NFOLDS,
thresh = 1e-3,
maxit = 1e3)
タイプは次のとおりです。私は「キャレット」のパッケージには、たとえば、異なるclassiferを使用するにはどうすればよい
> typeof(dtm_train_tfidf)
[1] "S4"
> typeof(train$setiment)
[1] "integer"
がお書きになります。
model_svm<-train(x = dtm_train_tfidf, y = train[['sentiment']],method='svmRadial')
問題はこれが機能しないということです。 キャレットパッケージなどでcv.glmnetではなく異なる分類子を実装する方法はありますか?この入力x、yとキャレット分類子の間には何らかの接続がありますか?もしそうでなければ、このタイプの入力を扱うことができるcv.glmnetのようなパッケージはありますか?
h2oパッケージでスパース行列を使用できますか? – toumperlekis
できますが、私は実際にはお勧めしません。効率的に処理することはできません。 –