私のRutaスクリプトはUIMAプロジェクトで正常に動作します。しかし、同じスクリプトがMavenプロジェクトに含まれていると、アノテーションの発生が減少します。MavenのRutaスクリプト - のタグ
LSQParen ANY+?{-PARTOF(RSQParen)} W{REGEXP("cited",true)} ANY+? RSQParen{->MARK(DZC_CITED,1,5)};
LSQParen W{REGEXP("cited",true)} ANY+? RSQParen{-PARTOF(DZC_CITED)->MARK(DZC_CITED,1,4)};
ルータスクリプトでは、 DZC_CITEDの発生の34ですが、Mavenの中で、それは27
例です:
入力:
1.Animal福祉情報センター[インターネット]。 Beltsville(MD):National 農業図書館(US); [2001年3月1日更新;引用2001年3月2日]。から入手可能: http://www.nal.usda.gov/awic/
2.ナーシングワールド[インターネット]。バージョン3.2。ワシントン:米国看護師協会; c1995-2001 [引用2001年3月12日]。から入手可能:http://www.ana.org。
3.HCMSオンライン[インターネット]。ヒューストン(TX):Harris County Medical Society; c2000 [updated 2001 Apr 25;引用2001年5月1日]。から入手可能:http://www.hcms.org。
屋根無しテキスト:
[updated 2001 Mar 1; cited 2001 Mar 2]
[updated 2001 Apr 25; cited 2001 May 1]
対象テキスト:
[cited 2001 Mar 12]
のデベロッパーですか?あなたはmavenプロジェクトでどのバージョンのruta-coreを使用しますか? (私はそこにいくつかの小さなバグフィックスチャネージが2.4.0の量子コードにあったと思います) –
私はMavenプロジェクトの単体テストとRutaプロジェクト(現在のトランク付き)の実行設定でテストしました。どちらのテストでも、3つの注釈が作成されます。私は、プロジェクトが古いバージョンのruta-coreを参照していると言っています。 –
btwの場合、おそらくより効率的な方法でパターンを指定できます。何かのような(テストされていない): '(LSQParen#< - {CitedInd;} RSQParen){ - > DZC_CITED};' ... CitedIndはマルチツリー単語リストによって注釈を付けられています...または正規表現 '引用した " - > CitedInd; ' –