0
同じデータセットを使用して、text2vecにtf-idf DTMとn-gramベースのDTMを作成しました。今、私はそれらを別々にglmnetを実行することが、私はCBIND経由にこれら2つのDTMのを組み合わせると、glmnetは私にエラー与える:text2vecの2つの結合されたDTM(glibc)でのglmnetの実行エラー
Error in validObject(.Object) :invalid class “dgCMatrix” object: length(Dimnames[1]) differs from Dim[1] which is 43895
dtm_train_tfidf =(19579 * 27511)行列を、そして
dtm_train_ngram =(19579 * 16384)の行列です。
つまり、それらは同じ正確な行数を持ち、それらをcBind(行列のcbind)を使って組み合わせて、glmnetを実行できるはずの大きな行列を得ることができます。 私はそれを実行することができないと私はこのエラーが発生します。 どうすれば修正できますか?
Dmitriy!あなたは私たちのRユーザーのために優れたパッケージを作っています。どうすればgithubの開発版を使うか、ハッシュ・ベクトル化ツールからdtmのcolnamesを削除するのですか? – Akhil
"devtools :: install_github(" dselivanov/text2vec ")"を実行して解決しました。コードは完全に実行されます。ありがとうドミトリー!! – Akhil