opennlp

    0

    1答えて

    私は、Apache OpenNLPのAPIを使用してトークナイザを作成しようとしています。私は自分のサイトからコードを抽出しましたが、Tokenizeクラスの次のコード行で「互換性のない型」エラーが発生します。 Tokenize tokenizer = new TokenizerME(model); 互換性がないと思われるので、このエラーの原因を知っている人はいますか?私は今、これをソートしている

    1

    2答えて

    銀行ワイヤ取引のコメントのような自然なテキストからエンティティ(名前、住所、組織)を抽出しようとしています。 NLTK、OpenNLP、およびCoreNLPが使用されていることは明らかです。 結果を改善する方法はありますか? テキストは次のように見ることができ、 EVERITT 620122T NAT ABC INDIA LTD REF ROBERT FINEMANN - REASON SHOPレ

    1

    1答えて

    文章を文章に分割することになっていた小さなプログラムには、OpenNLPを使用しました。 ドキュメントを読み、テストケースを通過した後にタスクを完了することはできましたが、作成したときでもすべての略語(例のYahoo!など)を学習する必要があることに気づくことはできませんでしたカスタムの省略形辞書をSentenceDetectorFactoryに渡して、それを訓練するために使用しましたSenten

    -1

    3答えて

    私はArrayListのトークンを返します。このメソッドを持っている: public static String[] Tokenize(String input) throws InvalidFormatException, IOException { InputStream is = new FileInputStream("en-token.bin"); Tokenize

    0

    1答えて

    で停止のpythonのためにこのOpenNLPラッパーに関する問題があります。何らかの理由でhttps://github.com/rohithb/openNLP-python-wrapper を、文検出器は、このラッパーを使用して、動作しません。私はそれで大丈夫ですし、NLTKが提供する文章検出器に切り替えました。問題はOpenNLP Tokenizerに出力を戻すときに始まります。あなたが見るこ

    -1

    1答えて

    インドの名前のためにopennlpをトレーニングしようとしているうちに、次のような反応があります。 $ opennlp TokenNameFinderTrainer -modelエンNER-person.bin -langエン -dataエンNER-person.train -encoding UTF-8 私のトレーニングデータが入っている Indexing events using cutoff

    1

    1答えて

    は、私はこのようにそれを試してみた窓 上opennlp-1.6.0とopennlp-1.5.3をインストールしたい、 は、システム変数 とパス を追加しました私は、コマンドプロンプトを開き、opennlp入力すると は、出力が C:\>opennlp OpenNLP 1.6.0. Usage: opennlp TOOL where TOOL is one of: Doccat l

    2

    1答えて

    JAVAでopennlpを使用すると、どのようにしてtxtファイル内のすべてのトークンの頻度を得ることができますか?私はtokenizer.getTokenProbabilities()を使用しようとしますが、単語の頻度ではなく確率のようです。どんな方法をお勧めしますか?