プレーンテキストに変換されたhtmlドキュメントを使用してTokenNameFinder用のトレーニングセットを作成していますが、精度が低く、トレーニングの一部としてHTMLタグを使用したいと考えています。太字の単語、異なるマージンサイズの文章。 OpenNLPはこれらのタグを受け入れ、使用してルールを作成しますか? これらのタグを使用して精度を向上させる別の方法はありますか?OpenNLPはトレーニングの一環としてHTMLタグを使用できますか?
1
A
答えて
0
OpenNLPを訓練するためにHTMLタグを使用することで何が意味するかは不明です。 列入力が注釈付きトークン化の文です:あなたは注釈を必要とする標準ツールを使用してOpenNLPモデルを訓練するために
<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . <START:person> Vinken <END> is chairman of <START:company> Elsevier N.V. <END> , the Dutch publishing group .
は、この規則に従います。アノテーションはXML標準に準拠していないことに注意してください。
トレーニングに使用するHTMLドキュメントに注釈を直接埋め込むことができます。それは追加の文脈でクラシファイアを助けるかもしれませんが、私はそれについての実験的な結果を読んだことはありません。
トレーニングデータはトークン化する必要があります。単語と句読点の間には、テキスト要素とhtmlの間だけでなく、空白も含める必要があります。
<p> <i> Mr . <START:person> Vinken <END> </i> is chairman of <b> <START:company> Elsevier N.V. <END> </b>, the Dutch publishing group .
関連する問題
- 1. カテゴライザモデルのトレーニングOpennlp
- 2. BRATを使用したOpenNlpのモデルの作成とトレーニング?
- 3. OpenNLPドキュメント分類のトレーニング
- 4. CakePhpはjsonと一緒にHTMLタグとBODYタグを返していますか?
- 5. jQueryを使用してHTMLタグをストライピングするときのエラー
- 6. スタンフォードNERトレーニングの機能としてposタグを使用する方法は?
- 7. DOMを使用してW3C仕様のすべてのHTMLタグをエコーすることはできますか?
- 8. はopenNLP互換性のあるトレーニング形式にデータを変換し、私はここに利用できるmoviewレビューデータセットにopenNLP使用して評判分析上で動作するようにしようとしています
- 9. AsyncHttpResponseHandlerまたはAsyncHttpClientクラスを使用してHTMLタグを見つけることはできますか?
- 10. opennlpのネストされたタグ
- 11. タグ/ボタンを公開フィルタとして使用できますか?
- 12. RailsとHTML Framework iUIを一緒に使用できますか?
- 13. PHPで正規表現を使用しているときにHTMLタグが一致しません
- 14. struts2タグの代わりにSimple HTMLタグを使用できますか?
- 15. substr JQueryを使用してHTMLタグを返しますか?
- 16. CSSを使用して、HTMLタグのユーザー定義属性を対象にすることはできますか?
- 17. タグなしのときにjavaを使用してHTMLからテキストを収集
- 18. html selectタグにaria-required = "true"を使用できますか?
- 19. NFCタグとしてAndroidを使用することはできますか
- 20. C#HttpWebRequestを使用してdhtmlxからHTMLタグを取得できません
- 21. <time> HTMLタグを使用してSQLデータをフォーマットすることはできますか?
- 22. HTMLテーブルでrowspanを1.5として使用できますか?
- 23. Djangoフラットページを改行付きのプレーンテキストとしてレンダリングする方法(htmlタグは使用できません)
- 24. javacriptタイプのスクリプトタグ内のすべてのHTMLタグを使用することはできますか
- 25. Cocos2dでは、単一のオブジェクトに複数のタグを使用できますか?
- 26. データの一部をロックとして使用できますか?
- 27. RegExを使用して終了タグとHTMLの開始タグを正しく一致させる
- 28. sedを使用してHTMLタグのコンテンツを置き換える
- 29. jQueryを使用してhtmlタグのテキストを抽出できません
- 30. sqlを使用してxmlをクエリするとき、HTMLタグをどのように保持しますか?
ありがとうございます!それはまさに私が望んでいたものです。今、HTMLタグで精度をテストします。私の列車入力はすでにトークン化されています。 – Shyba