いくつかのドキュメントにラベルを付けるために、LDAアルゴリズムを試しましたが、結果はあまりにも厄介でした。私は管理されたアプローチを使用することにしました。私は独自のトピックワードマトリックスを作成しましたが、ドキュメントトピックマトリックスの生成方法はわかりません。トピックワードマトリックスを使って訓練できる良いトピックモデリングアルゴリズムを知っていますか?トピックモデリングとLDAを使用した機械学習
0
A
答えて
1
正しいトピック語マトリックスが作成されている場合は、各文書のトピックの重みを計算するだけで済みます。たとえば、各文書の各単語の出現を使用し、それらの単語のトピックの重みを合計することができます。出現回数のようないくつかの係数を追加する必要があるかもしれませんが、それはかなり簡単です。
LDAアルゴリズムを使用することもできますが、トピックワードマトリックスを処理するためのトレーニングステップは無視してください。どの実装を使用しているのか分かりませんが、Sklearnのいずれかに従うと、直接components_
という属性として渡してからtransform
関数を使用できます。
関連する問題
- 1. 深い学習と機械学習
- 2. 機械学習用レンタルサーバー
- 3. テキストマイニングと機械学習
- 4. 機械学習、Python
- 5. 機械学習システム
- 6. 機械学習udacity
- 7. Python - 機械学習
- 8. 機械学習モデルテスト
- 9. RとrandomForestSRCパッケージを使用した機械学習
- 10. 使用機械学習アルゴリズムデータ構造(メモリ)
- 11. ReLu return NaNを使用した機械学習
- 12. 機械学習を使用した電子デスクトップアプリ
- 13. 機械学習を使用した数値予測
- 14. Luigiを使用した反復機械学習ETL
- 15. 機械学習を使用したJSONドキュメントクラスタリング
- 16. 機械学習を使用した異常検出の作成
- 17. numpyを使用したグラディエント降下機械学習
- 18. 機械学習のヌルクラス
- 19. 機械学習 - 分類アルゴリズム
- 20. Coursera機械学習:グラデーションデサントベクトル化
- 21. ロボットでの機械学習
- 22. 機械学習のJavaライブラリ
- 23. 機械学習Webサービス
- 24. aws機械学習エンドポイント
- 25. 機械学習データのフォーマット
- 26. GATEの機械学習
- 27. 機械学習分類アンサンブル
- 28. 反復機械学習アルゴリズム
- 29. 機械学習の提案
- 30. AWS機械学習エラーS3
ありがとうございました。私はsklearnの実装を使用しています。 'AttributeError: 'LatentDirichletAllocation'オブジェクトに属性がありません 'exp_dirichlet_component_''機械学習アルゴリズムの専門家ではありませんが、このコンポーネントをどのように起動するか説明できますか? –