2017-03-28 5 views
2

マークアップタグの間にデータを検出するルールを作成しようとしています。マークアップの間にデータをアノテーション

入力データフォーマットは私の場合は、基本的には、開始タグと終了タグ 間でデータを検出するために、ここで必要なものの例

<1> Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim</1> 
<2> nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim</2> 

のために固定されている出力が1と2

する必要があります私がしようとしています以下のルール。

Document{->ADDRETAINTYPE(MARKUP)}; 

STRING sStart = "<"; 
STRING sEnd = ">"; 
DECLARE spanStart; 
DECLARE spanEnd; 

DECLARE ZONE; 
sStart -> spanStart; 
sEnd -> spanEnd; 

spanStart NUM spanEnd{->MARK(ZONE,2)}; 

しかし、彼らはMARKUPであるため、数

答えて

1

「1」と「2」がNUMとして検出されていないとして1 & 2が検出されていないとして、値が検出取得されていません。シーディングは、ドキュメントの分離していない分割を作成します。たとえば、ユースケースのMARKUPなど、現在の最小のパーツ内に注釈を作成する場合は、質問でspanStartとspanEndを使用したのと同じように、簡単な正規表現ルールで注釈を作成できます。

MARKUP->{"\\d+"-> ZONE;}; 

または

MARKUP->{"</?(\\d+)>"-> 1 = ZONE;}; 

免責事項:

私のようなものを使用することになり、私は

+0

どうもありがとうピーターをUIMAルタのデベロッパーですか。 1つのクイッククエリ私は段落などのいくつかの入力として全体の入力をマークできますか? – Gaurav

+1

'文書{ - >段落};'または 'マーク(段落)' –

+0

あなたは救い主です。 – Gaurav

関連する問題