が、私はこのような何かをしUIMAツールチェーンを持っていると仮定しますUIMA:プラグ&differenチームのチェーンのためのアノテーターを再生
トークン化 - > POSタギング - にカスタムタグを使用する> - >私のカスタムタグ/注釈を割り当てますより多くのタグを割り当てる - >それ以上の処理。
POSタグを付けた直後に、2つのカスタム品目の間にエンティティ認識(POSタグを使用しますが、あまり必要ない)を使用することは可能でしょうか?
私はこのタイプのシステムに起因する複雑さを見ることができるので、この質問をしています。特に、最も困難なケースは、カスタマイズされたものの間、またはその直後に、第三者のERアノテータをプラグインすることです。サードパーティの注釈者は、カスタムタグがそこに存在するとは期待しません。
ただし、注釈を見たり注釈を変更したりすることなく注釈を通過させるだけの追加の注釈があります。ですから、原理的にはこれが可能だと思います。私はUIMAがこれをサポートしているのかどうか分かりませんし、どこにでも厳密な入力をして独自のフルチェーンを作成しているのです。
これは箱の外にできない場合は、我々は現在、他の注釈がある場合、POSタグがから独立して利用可能な場合、彼らはどこにでも差し込むことができるようにカスタムアノテーターを書くことができます。私。注釈の作成者は、必要な注釈、追加する注釈、存在してもいなくてもよい任意の数の注釈が存在する可能性があることに注意しており、それらを気にせずに渡すだけです。
私はmy.namespace.Tokenを持っていて、別のアノテーターがother.namespace.Tokenを必要とすると仮定します。これは基本的に同じですが、my.namespace.Tokenには1つの追加属性があります。 1つを別のものに変換することは可能ですか(AEを追加することなく、タイプシステムのXMLマッピングで可能です)? –
おそらく、それを行うことができる既存のAEがあります(どこを覚えていないか...)。または、ConfigurableFeatureExtractor(http://uima.apache.org/d/uima-addons-current/ConfigurableFeatureExtractor/CFE_UG.html)を使用することもできます。通常、私はちょうどAEを書く: - / – Renaud