2016-10-28 12 views
1
私はそれがまた、非emptypassageをカバー

は空の通路UIMAルタを見つける必要があり

サンプル入力ファイルannotate.Butする正規表現パターンを使用document.Iに空の通路に注釈を付ける必要がある

<p class="MsoNormal"><a name="para10001">You can easily change the formatting</a></p> 
<p class="MsoNormal"><a name="para10002"> </a></p> 
<p class="MsoNormal"><a name="para10003"></a></p> 
<p class="MsoNormal"><a name="para10004">To change the overall look of your document</a></p> 
<p class="MsoNormal"><a name="para10005"></a></p> 
<p class="MsoNormal"><a name="para10006"></a></p> 

ルタスクリプト:

"<p(.*?)><a name=\"para(\\d+)\"></a></p>"->EMPTYPASSAGE; 
    "<p(.*?)><a name=\"para(\\d+)\"> </a></p>"->EMPTYPASSAGE; 
         or 
    "<p(.*?)><a name=\"para(.+?)\"></a></p>"->EMPTYPASSAGE; 
    "<p(.*?)><a name=\"para(.+?)\"> </a></p>"->EMPTYPASSAGE; 

答えて

1

あなたの正規表現は、いくつかの<p>タグを消費します。次のように試してみてください:

"<p([^>]*?)><a name=\"para(\\d+)\"></a></p>"->EMPTYPASSAGE; 
"<p([^>]*?)><a name=\"para(\\d+)\"> </a></p>"->EMPTYPASSAGE; 
関連する問題