答えて

7

情報抽出

(IE)が自動的に非構造化及び/又は半構造化機械可読文書から構造化された情報を抽出するタスクです。ほとんどの場合、このアクティビティは自然言語処理(NLP)を使用して人間の言語テキストを処理することに関係しています。自動注釈や画像/音声/映像からのコンテンツ抽出のようなマルチメディア文書処理における最近の活動は情報抽出と見ることができる。

テキストマイニング

は、情報資源のコレクションから必要な情報に関連する情報資源を得るための活動です。検索は、メタデータまたは全文索引付けに基づいて行うことができます。

テキストマイニングは情報検索に比べて広大です。典型的なテキストマイニングタスクには、文書分類、文書クラスタリング、オントロジー構築、感情分析、文書要約、情報抽出などが含まれる。 情報検索としては、通常、文書のクロール、構文解析、索引付けを扱う。

Source

1

まず、これらの2つの重要な単語の意味を見てすることができます。

テキストマイニングはテキストのソースからの事実とイベントを抽出することにより開始し、さらに、従来のデータマイニングによって探求されている新しい仮説を形成することができますresources.It様々なテキストの自動解析によって、新しい、以前に未知の情報の自動発見でありますおよびデータ分析方法。

情報抽出は、NLP(自然言語処理)あなたは生のテキストから隠された情報を抽出するために、マシンを訓練&機械学習の問題の詳細です。

だから違いは、テキスト抽出は情報抽出と比較して広大な領域です。 テキストのマイニングは、非構造化テキストのパターンを探しています。情報抽出(IE)の関連するタスクは、自然言語文書の特定のアイテムを見つけることです。

関連する問題