2016-06-01 8 views
1

私はJava Mavenプロジェクトからrutaスクリプトを動的に実行しています。スクリプトはHTMLファイルに注釈を付け、出力はさらに処理されます。 coveredTextには以下のようなHTMLタグが含まれています。ruta出力またはJCasからのMARKUPを無視するにはどうすればよいですか?

(A + B)< SUP> 2 </SUP>は==>式

としてマークされているしかし、私は

としてたい(A + B)2 ==>上書きであります別の注釈として取り込まれ、後で処理されます。

予想される解決方法に到達するにはどうすればよいですか?

+0

、文書のテキストは静的です。テキストを変更する場合は、新しいビュー/ CASを作成する必要があります。 rutaには、変更されたドキュメントテキストを持つcasを作成できる3つのコンポーネントがあります:HtmlConverter、RutaModifier、RutaCutter。さらに処理したい場合は、ソファマッピングを使用した集計AEが必要です。 –

+0

どのように行うには? Plzはいくつかのコーディングやリンクを教えてくれます。ありがとう! –

答えて

1

UIMAでは、文書テキストは静的です。テキストを変更する場合は、新しいビュー/ CASを作成する必要があります。 rutaには、変更されたドキュメントテキストを持つcasを作成できる3つのコンポーネントがあります:HtmlConverter、RutaModifier、RutaCutter。同じパイプラインでさらに処理したい場合は、ソファマッピング(またはソファ対応の分析エンジン)を使用した集約AEが必要です。

analysis enginesとそのusageについてのドキュメントがあります。これらのルールにはexample projectがあり、考えられる問題についてはStackOverflow questionもあります。ソファのマッピングに関する情報はUIMA documentation

(免責事項:私はUIMAルタのデベロッパー)で見つけることができUIMAで

関連する問題