2017-08-16 6 views
4

単語マッチングの場合や、特殊なケースを無視すると、あいまいさの選択肢がありますか? EXのためにUIMA rutaのふくそう

:私はそこdocumentationによる

Tiger-またはMONKEY $

のようないくつかの特殊文字に直面した場合に

STRINGLIST AMIMALLIST = {"LION","TIGER","MONKEY"}; 
DECLARE ANIMAL; 


Document {-> MARKFAST(ANIMAL, AMIMALLIST, true)}; 

私はリストと言葉を一致させる必要がありますどのように使用するにはどのようなアイデアですか? または私はSCOREまたはMARKSCORE

+0

@PeterKlueglあなたはここに助けることができますか? – Gaurav

+1

はい、次の日に回答を追加します。 –

答えて

0

ここで考慮すべきいくつかの側面がありますを使用することができます。一般に、UIMA Rutaは辞書ルックアップでの曖昧さをサポートしていません。 SCOREおよびMARKSCOREは、連続ルールでいくつかのスコアリング(実際にあいまいではない)を導入するために利用できる言語要素です。あなたがあなたの質問であなたが与えた例では、ファジーマッチングは本当に必要ありません。

UIMA Rutaの辞書ルックアップは、RutaBasicアノテーションで動作します。これらのアノテーションは、UIMA Ruta自身によって自動的に作成され、管理されます(また、他の分析エンジンやルールによって直接変更することはできません)。 RutaBasicアノテーションは、アノテーションが参照している最小のフラグメントを表します。デフォルトでは、RutaEngineのシーダーは、単語(W - >CWSWCAP)と他の多くのトークン、つまりSPECIAL(または$)のアノテーションを作成します。これは、RutaBasicアノテーションもあり、辞書ルックアップがこれらのトークンの間に存在している可能性があることを意味します。その結果、タイガーとモンキーに注釈を付ける必要があり、質問の例は実際には(私はそれをテストした)を動作させる必要があります。 SPECIALANIMALに含めるには、ポストポーシングが必要なことがあります。

編集距離を辞書検索(Multi Tree Word List、TRIE)に使用する機能もあります。しかし、この機能は数年間維持されていません。特定の置換えに対して異なる重みをサポートする必要があります。これが曖昧であるかどうかはわかりません。

免責事項:私はUIMAルタのデベロッパー

関連する問題