2017-03-12 5 views
0

Watson Explorerコンテンツアナリティクススタジオで、同じ種類の複数の注釈を生成する方法を探しています。 私は1つの注釈を通過しません、私はすべての "テキストコンテナ"を選択することができますが、それはまだ1つの注釈を生成する。 私は「火のこのレベルのすべてのルール」を試みたが、それはまた、所望の結果にContent Analytics Studioで同じタイプの複数のuimaアノテーションを抽出する方法

いくつかのサンプルを以下に

を与えるものではありません宿題が著書「ボンジュールフランス」の章1,2および4になります

3への本の中で2と第2章の3ビッグ歴史

第1章の内容は次のおしっこのためのテスト

の一部となる段落を再訪宿題は教科書

のページ1,2および5を読み取ることでkは私がこれまで持っていることは、最初の行のために予想される結果、以下のヘルパー(スクリーンショットを参照)

enter image description here

です

  1. 章1本 "ボンジュールフランス"
  2. 章2本「B:値/機能を持つタイプSinglePieceOfContentの3人の注釈ですフランス」
  3. 章4集 『ボンジュールフランス』

onjour私は、カスタム注釈を構築避けたいが、それは移動するための方法である場合、私は確認されていることを確認したいと思います。

+0

フレーズまたは集計はどのルールタイプを使用していますか?私はあなたが何をしようとしているかについて完全には分かっていません。しかし、あなたが言及する3つのアノテーションを生成するルールを作ることは、WEX Studioで可能になるはずです。 –

+0

@LeonardSaers私たちはフレーズルールを使用しており、WEXスタジオでこれを達成する方法は非常に興味があります – mpjjonker

答えて

1

これを行うには2通りの方法がありますが、どちらもちょっとぎこちないし、あなたの特殊なデータではうまくいかないかもしれません。

最初の方法は、1つの選択ルールで複数の注釈を作成できることです。だから、これを行うための強硬な方法は、このような(高レベル、介在トークンを無視して)ようなセレクタを持つことです。まずyour'reは、単一の文でやろうとして注釈の最大数を選び、そして、5を言う:

Selection: 
find chapter chapter? chapter? chapter? chapter? book 
rule create 5 annotations, each with limited span over just the N they refer to and add book covered text as a feature to each. 

第二の方法は、更新を使用することです。各章を識別し、 "デフォルト"に設定された文字列フィーチャーブックを含む注釈を作成します。ブックを識別する別のアノテーションを作成します。次に、このような集計ルールを作成します。

ルールは実際には作成されません。これは更新です。更新は一度に複数の注釈を処理できます。

+0

ありがとう、私はこれを試してみます。私たちはカスタムJavaアノテータを構築することでこれを解決しましたが、このアプローチもチェックアウトしたいと思います。 – mpjjonker

+0

すべての章が実際にテキストに記述されているときにこの作業を見ることができますが、 「第1章〜第4章を研究する」という文章から、 – mpjjonker

関連する問題