2016-12-15 3 views
0

私は平文文書を処理しており、文書にある大学/大学名のような実体を識別しています。これらの名前はさまざまな形式で書かれていますが、それらは単一の大学/大学の名前を指します。
例:
ジャワハルラル・ネルー工科大学ハイデラバード
J.N.T.Uハイデラバード
JNTUハイデラバード
JNTU-H
ネルー工科大学(JNTU)ハイデラバードNER:抽出された実体を単一の実世界の概念に関連付ける

上記のすべての名前は同じ大学の名前を参照してください。

これらの名前をどのようにして1つの大学/大学の名前に関連付けることができますか?
(これらの名前のいずれかを検索すると、同じ大学リンクが返されるため、何らかのウェブサービスやGoogle検索などがあります)

答えて

0

このタスクの名前は「エンティティリンク」です。いくつかのシステムでは、ほとんどの場合、Wikipediaを活用して(特にエンティティに言及するリダイレクト)、例えばBabelfyまたはDBpedia Spotlightのようなシステムを使用しています。

これらのサービスは、一意の識別子に関連付けるためにデータに依存しています。エンティティの表現が可能な場合、おそらくほとんどの場合(ただしあいまいな場合は)機能するはずです。しかし多くの場合、レキシコンは十分ではなく、おそらく未知のエンティティや言及に直面するでしょう。その場合は、既存のフレームワークを使用して独自のシステムを構築し、関連するエンティティおよび関連するデータベースを提供する必要があります。頭字語はフルネームから自動的に生成されます。

関連する問題