文書クラスタリングの結果を改善するために適用できる人工知能アルゴリズムはありますか?クラスタリングのためのアルゴリズムは、階層的であってもよいし、他のものであってもよい。 文書クラスタリング
はあなたが
-2
A
答えて
5
The Wikipedia article on document clusteringは「Recent Developments in Document Clustering」と呼ばれる、バージニア工科大学からのニコラス・アンドリュースとエドワード・フォックス2007年論文へのリンクが含まれてありがとうございます。私はあなたが「人工知能アルゴリズム」としてどのようなクラスになるのかはっきりとは分かりませんが、紙の内容をスキャンすると、ベクトル空間モデル、kmeans拡張、生成アルゴリズム、スペクトルクラスタリング、次元削減、フェーズベースモデル、比較解析。これはかなり数学的に密な治療法ですが、彼らが話しているアルゴリズムへの参照を慎重に入れています。
2
実際、クラスタリングはAIドメインの問題の1つです。そして、あなたが1つ下のレベルを下にしたいのであれば、それは機械学習の分野にあると言うかもしれません。この意味で、AIはドキュメントクラスタリングを改善しませんが、それを解決します。 Dumbledad mentionsいくつかの基本的な選択肢がありますが、あなたが毎回持っているデータのタイプは、異なるアルゴリズムでよりよく扱われるかもしれません。この問題には、多くのk-meansに基づく手法があります。そのような場合には慎重な播種が必要です。球状のk-means(Dhillonの論文を探す)は簡単で標準的なアプローチです。その他の拡張子はk-synthetic prototypesです。
サブスペースのクラスタリングも良い試みです。一般に、「ドキュメントクラスタリング」の記事では、「高次元のデータスペースと希薄なデータスペースでのクラスタリング」をチェックしています。
関連する問題
- 1. 白黒画像文書クラスタリング
- 2. 文書のクラスタリングと可視化
- 3. 文章クラスタリング
- 4. 平均シフトを使用した文書クラスタリング
- 5. apache solrクラスタリングで文書IDを取得する結果
- 6. PSOとK-meansをベースにしたテキスト文書クラスタリングがR
- 7. Pythonの文字列クラスタリング
- 8. テキスト文書をクラスタリングし、重複するトップ用語を取得する
- 9. 文書クラスタリングのためにSparkで複数のテキストファイルを読むには?
- 10. python:sklearnを使用した文書クラスタリングでメモリに問題がある
- 11. LDAモデルは文章(文書ではない)のクラスタリング/分類に役立つことができますか?
- 12. Python-画像クラスタリングにおけるクラスタリング
- 13. Tomcatクラスタリング
- 14. Ejabberdクラスタリング
- 15. クラスタリングWso2
- 16. ユーザーの読書習慣の分類的クラスタリング
- 17. クラスタリングPythonソースコード
- 18. グラフは、クラスタリング
- 19. Lucene.NETクラスタリングのオプション?
- 20. Apache Tomcat6のクラスタリング
- 21. テキストファイルのクラスタリング
- 22. クラスタリング時間イベント
- 23. クラスタリングとレプリケーション
- 24. クエリ(クラスタリング・キー)
- 25. WSO2 - カスタムポーリングアプリケーションのクラスタリング
- 26. WSO2 Enterprise Integratorクラスタリング
- 27. データのクラスタリング
- 28. ウィンドウマシンのTomcatクラスタリング
- 29. スケーリングとクラスタリングJPA
- 30. 番号クラスタリング/パーティショニングアルゴリズム