私は平文文書を処理しており、文書にある大学/大学名のような実体を識別しています。これらの名前はさまざまな形式で書かれていますが、それらは単一の大学/大学の名前を指します。
例:
ジャワハルラル・ネルー工科大学ハイデラバード
J.N.T.Uハイデラバード
JNTUハイデラバード
JNTU-H
ネルー工科大学(JNTU)ハイデラバードNER:抽出された実体を単一の実世界の概念に関連付ける
上記のすべての名前は同じ大学の名前を参照してください。
これらの名前をどのようにして1つの大学/大学の名前に関連付けることができますか?
(これらの名前のいずれかを検索すると、同じ大学リンクが返されるため、何らかのウェブサービスやGoogle検索などがあります)