2011-11-05 6 views
-1

私はWebからいくつかのテキストをマイニングするためのアプリケーションを作成しようとしていますが、テキストマイニングを実行する最良の方法は何か分かりません。テキストマイニングの基本的なアルゴリズムは何ですか?

この質問で私が望むのは、テキストマイニングを実行するために最もよく使用されるテクニック/アルゴリズムが何であるかを知っていて、索引付けではなくドキュメントで情報検索を行うものです。

答えて

5

テキストマイニングは広義の用語であり、テキストに適用される機械学習を意味します。一般的なテクニックには、k -nans Bayesと線形SVM分類tf-idfベクトル化SVD(テキストに適用するとLSAと呼ばれる)、潜在的なディリクレ割り当てが含まれます。したがって、「一部のテキストマイニング」を実行することは、「何らかの情報検索」を行うのと同じように、何かを意味する可能性があります。

Bing Liuの書籍Webデータマイニングを参照してください。

関連する問題