私は、トピックモデリングの最も一般的なテクニック(テキストから可能なトピックを抽出する)がLatent Dirichlet allocation(LDA)であることを読んだ。トピックモデリングにWord2Vecを使用する
しかし、Word2Vecでトピックモデリングを試してみると、ベクトル空間の単語をクラスタリングするのにはいいですか?したがって、クラスタはトピックと見なすことができませんでしたか?
いくつかの研究のためにこのアプローチに従うことが理にかなっていると思いますか?最終的に私が興味を持っているのは、トピックからテキストからキーワードを抽出することです。 Word2Vecで
私は最近、これらの行に沿って何かを試しました。Word2Vec(またはGloVe)ベクターをクラスタリングすることで、一貫したトピックを得ることができます:goo.gl/irZ5xI – duhaime
これは確かに可能ですが、トピックモデリングとは言いません。 – jknappen
@duhaimeご返信ありがとうございます!あなたが取り組んでいることはまさに私が探しているものです!場合によっては、クラスターを、例えば、あなたが抽出したトピックと比較することができます。 LDA? 私はこのトピックに慣れていないので、関連する研究論文を見つけることができるキーワードを教えていただければ幸いです – user1814735