私は短いテキストの話題モデリングを扱っており、同じテーマに焦点を当てた3つのモデル、すなわちBTM、WNTM、 )。WNTM、BTM、LF-LDAのような短いテキストのトピックモデルは、ドキュメント用語行列のようなものを作成しますか?
私は従来のLDA(これはRパッケージtopicmodelsを使用して実装しました)では、テキスト文書の構造化されていない形がDocument-Term matrix(DTM)の構築を介してコンピュータ可読形式に変換されています。
私は、上記のモデルがDTMに似たマトリックスを作成する場合、特に同様の実装方法を使用しているのだろうかと思います。誰もそれを知っていますか?残念ながら、私は元の論文を読むことによってその情報を見つけることができませんでした。
ありがとうございます!
あなたの質問はプログラミング問題ではなく、むしろモデルとその構造に関する一般的な質問ですので、SOの代わりに[Crossvalidated](http://stats.stackexchange.com)で質問することをお勧めします。私の知るところでは、LDAやCTM(VEMやGibbs)以外のモデルをカバーするRのトピックモデリングは実装されていません。対応するパッケージは 'topicmodels'、' lda'、または 'text2vec'であり、それぞれわずかに異なるサンプリング/推定アルゴリズムを使用します。 –