topic-modeling

    5

    2答えて

    現在のMahout 0.8-SNAPSHOTには、トピックモデリング用の折りたたみ変分ベイズ(cvb)バージョンが含まれており、cvbを並列化してより効果的に行うことができるため、Latent Dirichlet Analysis(lda)残念ながら、例を実行して意味のある出力を生成する方法については、ldaのドキュメントしかありません。 このように、私がしたい:一部のテキストが正しく はCVB

    8

    1答えて

    私は、Mallet 2.0.7でLDAトピックモデリングを実行しようとしています。私はLDAモデルを訓練することができ、トレーニングセッションからの出力によって判断して良い結果を得ることができます。また、私はそのプロセスで構築された推論を使用して、トレーニングファイルを再処理するときに同様の結果を得ることができます。しかし、私が大きなトレーニングセットから個々のファイルを取り出し、推論を使ってそれ

    12

    6答えて

    使用gensim LSAのドキュメントセットからトピックを抽出できましたが、LDAモデルから生成されたトピックにどのようにアクセスできますか? print_topics()リターンNoneTypeのでlda.print_topics(10)コードを印刷すると、次のエラーが発生しました: Traceback (most recent call last): File "/home/alva

    4

    2答えて

    Rのtmとパッケージを使って、ニュース記事のコーパスをトピックモデルにしています。しかし、私は""として表現されている "非文字"問題が発生しているので、私の話題はうんざりしています。ここに私のワークフローは次のとおりです。私はLDAモデルを訓練するとき text <- Corpus(VectorSource(d$text)) newtext <- lapply(text, tolower)