[OK]を、私はOpenNLPOpenNLPでNamed Entity Recognizerの識別子を訓練する方法は?
FileReader fileReader = new FileReader("train.txt");
ObjectStream fileStream = new PlainTextByLineStream(fileReader);
ObjectStream sampleStream = new NameSampleDataStream(fileStream);
TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap());
nfm = new NameFinderME(model);
私は何かが欠けている場合の何か間違ったことをやっている場合、私は知らないからNER識別子を訓練するために、次のコードを持っているが、分類が動作していません。私はtrain.txtが間違っていると思います。
エラーは、すべてのトークンが1つのタイプに分類されるというエラーが発生します。
私のtrain.txtデータは、次の例のようなものですが、エントリのバリエーションと量が非常に多くなっています。もう一つのことは、私は、時間ごとのテキストから単語ごとに単語を分類し、すべてのトークンではないことです。
<START:distance> 8000m <END>
<START:temperature> 100ºC <END>
<START:weight> 50kg <END>
<START:name> Renato <END>
誰かが私が間違っていることを示すことができますか?
OpenNLPのどのバージョンを使用していますか教えてください。私はOpenNLP 1.5.1を使用しているので、temparatue、距離と重量のモデルファイルはありません。 –
@ raj.singh私はOpenNLPを使用していません。私は私の目的のために自分の分類子を今コーディングしています。 –
こんにちは@Renato Dinhani、私は同じ問題を抱えています。どうすればあなたのアプリケーションでこれを解決できますか?私はtrain.txt例外:java.security.NoSuchAlgorithmException –