トピックモデリングは、コレクション内のクラスタを効果的に識別する、ドキュメントコレクション内のトピックの分布を識別します。トピックモデリングは文書のクラスタリングを行うテクニックだと言うのは正しいですか?トピックモデリングとドキュメントクラスタリングの関係は何ですか?
答えて
トピックは、ドキュメントのクラスタとはまったく異なります。結局のところ、トピックはドキュメントで構成されていません。
しかし、これら2つの技術は実際に関連しています。私はトピックモデリングは、どのように似たドキュメントがあるかを判断する実行可能な方法であると考えています。したがって、ドキュメントクラスタリングの実行可能な方法です。トピック分布(実際ベクトル)として各文書を表すには、トピックモデリング技術は、異なる単語の数から特徴次元を減らす
は、トピックの数に(コーパスに)現れました。ドキュメント間の類似性トピックの分布は、コサインのメトリックや他の多くのメトリックを使って計算することができます。これらのメトリックは、ドキュメント自体のテーマ/テーマの類似性を反映しています。この定量化された類似度に基づいて、多くのクラスタリングアルゴリズムを適用して文書をグループ化することができる。
そして、この意味では、トピックモデリングはドキュメントのクラスタリングを行う技術だと言うのは間違いないと思います。
クラスタリングと分類の関係は、トピックモデリングとマルチラベル分類の関係と非常によく似ています。
単一ラベルのマルチクラス分類では、ドキュメントごとにラベルを1つだけ割り当てます。クラスタリングでは、各ドキュメントを1つのグループにまとめます。実際には、ラベルを定義するときにクラスターを事前に定義することはできません。この事実を無視すれば、グループ化とラベル付けは本質的に同じことです。
しかし、現実世界の問題では、フラットな分類だけでは不十分です。多くの場合、ドキュメントは複数のカテゴリ/クラスに関連しています。したがって、我々はマルチラベル分類を活用する。ここでは、各文書を複数のグループ/トピックの下に置くことができるように、トピックのモデリングを複数ラベル分類の監督されていないバージョンとして見ることができます。ここでもまた、ラベルとしてどのトピックを使用するかを事前に決めることができないという事実は無視しています。
- 1. Yii2:関係名とは何ですか?
- 2. phpのclassとcall_user_func()関数の関係は何ですか?
- 3. EnumとEnumerationの関係は何か
- 4. IS-A関係とHAS-A関係の違いは何ですか? Java
- 5. ブレンドとは? WPFとの関係は何ですか?
- 6. JavaScript/HTML/jQueryとの関係で ".el"とは何ですか?
- 7. MyISAMテーブルのphpMyAdminでは "内部関係"とは何ですか?
- 8. Angular2/SystemJSでは、systemjs.config.jsと.import()の関係は何ですか?
- 9. "カーネルコール"と "システムコール"という用語の関係は何ですか?
- 10. AppDelegateとRootViewControllerとUIApplicationの関係は何ですか?
- 11. ng buildとngcの関係と違いは何ですか
- 12. tomcatとjdkとwebアプリケーションの関係は何ですか?
- 13. XOauthとOAuthとの関係は何ですか?
- 14. ES6とAngularとJqueryの関係は何ですか? Vue.js
- 15. OpenId ConnectとIdentityServerとIdentityの関係は何ですか?
- 16. Rails3 - テスト - 関係エラーとは何ですか?無効ですか?
- 17. Intelのコアi *とコアの数の関係は何ですか?
- 18. アイソメの角度とスケールの関係は何ですか?
- 19. GoogleのApp Engine SDKとCloud SDKの関係は何ですか?
- 20. m-m関係のmappedByとbelongsToの違いは何ですか?
- 21. ASP.NETプロバイダモデルとのMicrosoftエンタープライズアプリケーションブロックの関係は何ですか?
- 22. javascriptのNumberとFunction.prototypeの関係は何ですか?
- 23. スピネーカーのプロジェクトとアプリケーションの関係は何ですか?
- 24. Neo4jとSQLの関係の違いは何ですか?
- 25. クラス "タイプ"と特定のタイプの関係は何ですか?
- 26. javaのパッケージとjarファイルの関係は何ですか?
- 27. main()メソッドとJavaのメインスレッドの関係は何ですか?
- 28. Mavenのリポジトリと依存関係の違いは何ですか?
- 29. `Fabric`、` Composer`、 `Cello`と他のHyperledgerアプリケーションの関係は何ですか?
- 30. FFMpegのAVPacketとH.264 NAL Uintの関係は何ですか?