2016-05-14 2 views
2

私のRutaスクリプトはUIMAプロジェクトで正常に動作します。しかし、同じスクリプトがMavenプロジェクトに含まれていると、アノテーションの発生が減少します。MavenのRutaスクリプト - のタグ

LSQParen ANY+?{-PARTOF(RSQParen)} W{REGEXP("cited",true)} ANY+? RSQParen{->MARK(DZC_CITED,1,5)}; 
    LSQParen W{REGEXP("cited",true)} ANY+? RSQParen{-PARTOF(DZC_CITED)->MARK(DZC_CITED,1,4)}; 

ルータスクリプトでは、 DZC_CITEDの発生の34ですが、Mavenの中で、それは27

例です:

入力:

1.Animal福祉情報センター[インターネット]。 Beltsville(MD):National 農業図書館(US); [2001年3月1日更新;引用2001年3月2日]。から入手可能: http://www.nal.usda.gov/awic/

2.ナーシングワールド[インターネット]。バージョン3.2。ワシントン:米国看護師協会; c1995-2001 [引用2001年3月12日]。から入手可能:http://www.ana.org

3.HCMSオンライン[インターネット]。ヒューストン(TX):Harris County Medical Society; c2000 [updated 2001 Apr 25;引用2001年5月1日]。から入手可能:http://www.hcms.org


屋根無しテキスト:

[updated 2001 Mar 1; cited 2001 Mar 2] 

[updated 2001 Apr 25; cited 2001 May 1] 

対象テキスト:

[cited 2001 Mar 12] 
+0

のデベロッパーですか?あなたはmavenプロジェクトでどのバージョンのruta-coreを使用しますか? (私はそこにいくつかの小さなバグフィックスチャネージが2.4.0の量子コードにあったと思います) –

+0

私はMavenプロジェクトの単体テストとRutaプロジェクト(現在のトランク付き)の実行設定でテストしました。どちらのテストでも、3つの注釈が作成されます。私は、プロジェクトが古いバージョンのruta-coreを参照していると言っています。 –

+0

btwの場合、おそらくより効率的な方法でパターンを指定できます。何かのような(テストされていない): '(LSQParen#< - {CitedInd;} RSQParen){ - > DZC_CITED};' ... CitedIndはマルチツリー単語リストによって注釈を付けられています...または正規表現 '引用した " - > CitedInd; ' –

答えて

1

質問がすでにコメントで答えました。

同じルールでRuta Workbenchプロジェクトとビルドされたporjectで異なる量の注釈が作成される場合は、ruta-coreに対するMaven依存のバージョンとRuta Workbenchのプラグイン/機能のバージョン一致しない。バグは後のバージョンで修正されているため、異なるバージョンのアノテーションが異なる場合があります。

免責事項:私はルタワークベンチのバージョンは、使用しますUIMAルタ