2017-12-10 16 views
0

POSタギングやword2vecベクトルなど、いくつかのNLPベースの概念で任意のテキストを豊かにするサービスを開発することを考えていました。NLPの概念でテキストに注釈を付ける標準があります

オントロジーにも拡張する必要があります。

"トークン"、 "補題"またはオントロジの形式でテキストの異なる "表現"を "表現する"ための標準が存在するかどうか疑問に思っていました。

私は何かを見つけるのにかなり時間を掛けましたが、成功しませんでした。

多分、誰かが私にいくつかのヒントを与えるかもしれません。

答えて

0

にgensim & TSNEを使用して基本的な例を与えます。 は、これは表現することを可能にする: - 補題 - トークン - word2vec - 概念

0

DKProコアは均一言語を表す統一UIMAベース型システムを提供します。それらは簡単に交換するために、さまざまなNLPフレームワークにいくつかのラッパーを提供します。

their typesystemをご覧ください。例えば、DKProコアは、補題、トークン、POS、名前付きエンティティなどのタイプを提供します。

関連する問題