私はあるコメント集を持っており、それぞれのコメントがトピックについて議論しています。私はこれらのコメントで議論されたトップのトピックを把握したい。また、私はこれらのコメントをオンラインで受け取っています(つまり、私は一言で全体のコメントを取得するのではなく、これらのコメントを1つずつ処理する必要があります)。私はWord2Vecを使って特徴抽出を行い、k-means(クラスタはトピックに対応する)のようないくつかのクラスタリングアルゴリズムを適用し、次にトップmクラスタ(それらの中に最も多くのポイントを持つ)から答えを得ることができると考えました。しかし、問題はクラスタの数がわからず、いつでも新しいトピックがクラスタの新しいトピックについて議論する可能性があるため、異なるトピック(クラスタ)の数は固定されていないということです。 kの異なる値をもつk-meansを適用することによって解くことができる)。だから、他のクラスタリングアルゴリズム(DBSCANのような)を使用すべきか、その場合のアプローチは何か、あるいは私はまったく異なるアプローチを使用すべきですか?コメント集のトップmトピック
0
A
答えて
1
なぜ簡単なLDAを試してみて、トピックの数を多くして絞り込み、それを絞り込むことができないのですか?彼らはトピックモデルを構築するためのredditのコメントを使用する場所をsense2vecを見てみることができます似たノートでhttps://radimrehurek.com/gensim/models/ldamodel.html
関連する問題
- 1. トップのコメント、トップのユーザー、トップのユーザーとコメントmysql
- 2. トップ言葉各国の集計
- 3. グレーアウト編集トップ200行のSSMS
- 4. YouTube API V3を使用してYouTubeトップのコメントを投稿
- 5. LoadMoreボタンを使ったRecyclerViewトップに戻るFacebookのコメント
- 6. 弾性検索 - トピック別集約
- 7. Googleスプレッドシート集計関数SUM(K * M)エラー
- 8. Gensimを使用してトップ10のトピックを印刷するには?
- 9. トピックごとにコメントを印刷するには?
- 10. djangoのコメントを編集する
- 11. モーダルウィンドウのコメント編集モジュール(編集可能なテキスト)
- 12. コメントを編集VAIモーダルダイアログボックスが正しく
- 13. 編集Chromeで粘着性の入力要素がトップ
- 14. 'm a'とガード中のm() '
- 15. MonadRandom m => [g(m a)] - > m [g a]
- 16. C#コードでの単語コメントの編集方法(dsoframerを使用)
- 17. (Monad m、Monoid o)=> m o?
- 18. djangoのフロントページのdjango cmsのトップ編集バーを無効にする方法
- 19. トップ3のランク
- 20. のgnuplot:トップ
- 21. のUITableViewはトップ
- 22. FaceBook。すべてのコメントは1ページに集められます
- 23. AJAX CRUDはLaravel 5.3のコメントを編集しません
- 24. 関連集団の属性によってフィルタリングされた関連集計の集計で集計(トップ20のように)をソートする方法は?
- 25. ブートストラップ - トップ
- 26. SQLトップ
- 27. fbで作成されたコメントへのコメントのコメント数:コメント(サイトのコメント)
- 28. オープンCHMのトピック
- 29. FreebaseトピックのRDF
- 30. (サブクエリのトピック)