uima

    1

    1答えて

    2つの単語リストの値を一致させる必要があります(つまり、Wordlist1の1番目の位置とWordlist2の1番目の位置)。 サンプルwordlist1: A B E C C サンプルwordlist2: A92.8 B49.4 E16.0 C16.9 C49.4 まず私は、ドキュメントにWordlist1のコンテンツを見つける必要があり、その後、私はWordlist2

    1

    1答えて

    Apache UIMA Rutaから利用可能なExampleProjectを試しています。自分のファイルでいくつかのルールをテストしたいと思います。最初は、例外が発生しました。これは、UIMAが入力ファイルのエンコーディングを検出できないためだと考えています。入力ファイルをUTF-8に変換した後、私はもはや例外を取得しません。しかし、Rutaが正しくファイルを読み込んでいるかどうかはわかりません。

    1

    1答えて

    見出しレベル(レベル1、レベル2、レベル3)を多くの見出しからタグ付けしようとしています。フォントサイズの使用HTMLからの情報。最初に私は "<span style=\"font-family:\'(.+?)\'"->1=fontfamily; "<span style=\"font-family(.+?)font-size:\'(.+?)\'"->2=font size; のような正規表

    3

    1答えて

    ウイマルタのワードリストの最大サイズはいくらですか?私は国、州、都市名のリストを保存したいからです。

    0

    1答えて

    サンプル入力ファイルの一部であるかどうかを見つけるために:私はHEAD1" として「セクション87-89と節90-92を」注釈を付ける場合は、入力ファイルのサンプルから例えば <p class="Head1"><a name="para1">Sections 87-89</a></p> some text <p class="Head2"><a name="para2">Sections 90

    -1

    1答えて

    私はApache UIMAを初めて使用しており、Apache UIMAを使用してNLPパイプラインを構築しようとしています。ユーザーが文書(すなわちpdf、words)をアップロードするとき、Tika Annotatorを使用してデータを抽出したいと思います。私はpdacheやその他の文書からAPache Tikaを使ってテキストを抽出することができますが、このためにAnnotatorを書く方法と

    1

    1答えて

    私は自分のタイプを作成しています。ラベルはExampelについて(さらなる処理のための)全体マッチした文字列が含まれるように を必要とする、これは私のルールのようになります。 (W{REGEXP("myregex1")} W{REGEXP("myregex2")}) { -> CREATE(MyType, "label"=?)} あなたは「ラベル」の部分の後ろに疑問符を見ることができます。一致

    1

    1答えて

    Rutaスクリプトをデバッグすると、出力ファイルをロードするのに時間がかかりすぎます。どのくらいの時間がかかるのですか?

    1

    1答えて

    UIMAフィットパイプラインから簡単な例のRutaスクリプトを実行しようとしています。 STRING s; BOOLEAN a; STRING s2 = "LAuGH"; DECLARE Test; BLOCK(forEACH) W{}{ W{->MATCHEDTEXT(s), ASSIGN(a,equals(s,s2))}; W{->MATCHEDTEXT(s), A

    1

    1答えて

    TextRulerビューでは、トレーニングデータの入力数に制限はありますか。時間がかかり過ぎることがあります。制限する。 アルゴリズムで生成されたスクリプトを使用しようとすると、何らかのエラーが表示されます。 ERROR: Error in KEP, line 160, "SCRIPT": found no viable alternative 生成されたスクリプト:エラーについて SCRIP