2017-11-03 11 views
1

構造化されていないテキストから情報を抽出したい。構造化されていないテキストから正確な情報を抽出する方法

例えば、私のテキストは、「39の下のコントロールアメリカニューヨーク温度」である

私が欲しい情報が(「コントロール」、「アメリカニューヨーク」は、「温度」、「下」、「39」)です。

アクション情報を表す「control」と、アクション対象を表す「NewYork」と、指標となる「temperature」と、範囲を表す「39未満」とが含まれる。

ただし、テキストコンテンツの構造は様々です。

以下は典型的なケースです。

"Control NewYork temperature under 39" 
==>("control","NewYork", "temperature", "under", "39") 

"give some money to my brother" 
==>("give", "money", "my brother") 

"Adjust the height of the table" 
==>("adjust", "table", "height") 

私の問題についてご意見はありますか? ありがとう!

答えて

0

この種の構造化予測を行うには、いくつかのパラダイムがあります。 最も一般的なのは、次のとおりです。

使用フレーム意味論:http://www.cs.cmu.edu/~ark/SEMAFOR/

使っ意味役割ラベリング(SRL):http://cogcomp.org/page/demo_view/srl

主な違いは、フレーム意味論ながら、SRLの意味役割は、別の動詞の異なる意味を持っているということです意味論的概念のための一般的な役割を与える抽象である。

GithubでFrame Semantic ParsingまたはSRLを実行するツールを簡単に見つけることができます。しかし、SRLはより広く使用されています

関連する問題