uima

1熱

1答えて

2つの単語リストの値を一致させる必要があります（つまり、Wordlist1の1番目の位置とWordlist2の1番目の位置）。サンプルwordlist1： A B E C C サンプルwordlist2： A92.8 B49.4 E16.0 C16.9 C49.4 まず私は、ドキュメントにWordlist1のコンテンツを見つける必要があり、その後、私はWordlist2

1熱

1答えて

UIMAで入力ファイルのエンコーディングを指定するRuta Workbench

Apache UIMA Rutaから利用可能なExampleProjectを試しています。自分のファイルでいくつかのルールをテストしたいと思います。最初は、例外が発生しました。これは、UIMAが入力ファイルのエンコーディングを検出できないためだと考えています。入力ファイルをUTF-8に変換した後、私はもはや例外を取得しません。しかし、Rutaが正しくファイルを読み込んでいるかどうかはわかりません。

1熱

1答えて

Uima Ruta見出しレベル

見出しレベル（レベル1、レベル2、レベル3）を多くの見出しからタグ付けしようとしています。フォントサイズの使用HTMLからの情報。最初に私は "1=fontfamily; "2=font size; のような正規表

3熱

1答えて

単一のWordlist-UIMAルータの最大サイズ

ウイマルタのワードリストの最大サイズはいくらですか？私は国、州、都市名のリストを保存したいからです。

0熱

1答えて

注釈型が覆われたテキスト

サンプル入力ファイルの一部であるかどうかを見つけるために：私はHEAD1" として「セクション87-89と節90-92を」注釈を付ける場合は、入力ファイルのサンプルから例えば <a name="para1">Sections 87-89</a> some text <a name="para2">Sections 90

-1熱

1答えて

Apache UIMAを使用してNLPオペレーションパイプラインを構築する

私はApache UIMAを初めて使用しており、Apache UIMAを使用してNLPパイプラインを構築しようとしています。ユーザーが文書（すなわちpdf、words）をアップロードするとき、Tika Annotatorを使用してデータを抽出したいと思います。私はpdacheやその他の文書からAPache Tikaを使ってテキストを抽出することができますが、このためにAnnotatorを書く方法と

1熱

1答えて

UIMA Ruta複数のフィールドにまたがるラベルを作成

私は自分のタイプを作成しています。ラベルはExampelについて（さらなる処理のための）全体マッチした文字列が含まれるようにを必要とする、これは私のルールのようになります。 (W{REGEXP("myregex1")} W{REGEXP("myregex2")}) { -> CREATE(MyType, "label"=?)} あなたは「ラベル」の部分の後ろに疑問符を見ることができます。一致

1熱

1答えて

Rutaスクリプトをデバッグするとロードに時間がかかります

Rutaスクリプトをデバッグすると、出力ファイルをロードするのに時間がかかりすぎます。どのくらいの時間がかかるのですか？

1熱

1答えて

UIMA-Fitから実行すると、stringfunctionsを持つUIMA RUTAスクリプトが動作しません。

UIMAフィットパイプラインから簡単な例のRutaスクリプトを実行しようとしています。 STRING s; BOOLEAN a; STRING s2 = "LAuGH"; DECLARE Test; BLOCK(forEACH) W{}{ W{->MATCHEDTEXT(s), ASSIGN(a,equals(s,s2))}; W{->MATCHEDTEXT(s), A

1熱

1答えて

トレーニングデータの制限とは何ですか？-Uima Ruta

TextRulerビューでは、トレーニングデータの入力数に制限はありますか。時間がかかり過ぎることがあります。制限する。アルゴリズムで生成されたスクリプトを使用しようとすると、何らかのエラーが表示されます。 ERROR： Error in KEP, line 160, "SCRIPT": found no viable alternative 生成されたスクリプト：エラーについて SCRIP