私は現在、text2vec
パッケージのLDAを使用してトピックモデリングを行っています。私はdtm行列を作成し、次にとそのfit_transform
メソッドをn_topics=50
で適用しました。text2vec - トピックの単語は新しいデータで更新されますか?
各トピックのトップワードを見ているうちに、私の心に疑問が浮かびました。モデルを新しいデータに適用する予定です。以前にモデルでは遭遇しなかった新しい単語が出現する可能性があります。モデルは各単語をそれぞれのトピックに割り当てることができますか?さらに、これらの単語もトピックに追加されるので、get_top_words
を使用してそれらを見つけることができますか?
ありがとうございます。