2017-06-28 23 views
1

NLPを開く初心者です - NERを使ってエンティティを抽出し、Open NLP NERでエンティティ抽出のモデルを評価しました。 1つの単語のEG:「私はキャドバリーを買いたい」OpenNLPモデルを訓練して複数セットの単語を抽出する方法

しかし、それはマルチワードシナリオ例:のための作品に動作していません:モデルが選択する方法を訓練する「私はしたいが、アップルのMacBook」

をマルチワード

PS:NLPで提供されているBiGramsに関連する何かをする必要があることを理解しましたが、OpenNLPでどうやってやっていますか?

答えて

0

複数語にわたるトレーニングデータを提供する必要があります。 OpenNLP documentationから例:

<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 . Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .

上記形式の他に、IO/BIO/etc tagsも一般的です。あなたの例では

Apple MacBookはタイプProduct Nameの1つの実体かもしれないが、またProduct NameとしてCompany NameとしてAppleMacBookで、2である可能性があります。その仕組みはトレーニングデータに完全に依存しています。

このようなデータは、手動で作成することも、bratを使用して視覚的に作成することもできます。

関連する問題