core-nlpアノテーションパイプラインをデフォルト設定で使用して、トークン化からner_tagsまでを使用しようとしています。私は、 "tokenizer"モジュールが{副社長}と{タイトル}の代わりに{o、TITLE}というner_tagsの識別をもたらす2つの個別のトークン{副社長}として "副社長"を識別しているのを観察しました。どのようにNer_Tagsが適切なタイトルを識別するのに役立つかを、「副社長」を1つのトークンとして識別させるためにトークナイザを入手することができます。スタンフォードcore-nlpでトークン化する前にn-gramを識別する方法は?
0
A
答えて
2
TITLEをNERタグとして取得するために使用しているプロパティは何ですか?これは標準タグの1つではありません。トークンRegexNER注釈を使用している場合(たとえば、kbp
注釈)、副社長のようなマルチワードタイトルを選択する必要があります。少なくともcorenlp.runで動作します。
一般にNERスパンを1つの言葉に集約するのはトークナイザの仕事ではありません。 tokenizerは、 'vice'と 'president'を別々のトークンに分割する必要があります。どちらも適切なNERアノテーターによってTITLEとマークする必要があります。 entitymention
annotatorに興味があるかもしれません。これはNERの連続したタグをNERの言葉にグループ化しています。これは、TITLEとしてマークされた2つのトークンではなく、これらの言及は、文CoreMapのmentions annotation、またはsimple APIのList<String> mention(String nerTag)
またはList<String> mentions()
機能を使用して取得できます。
関連する問題
- 1. スタンフォードCoreNLP - 別の言語を設定するには
- 2. スタンフォードCoreNLP CoreLabelからIndexedWordを取得する方法は?
- 3. スタンフォードCoreNLP:ビルディングエラー(NoSuchMethodError)
- 4. スタンフォードNLP CoreNLP .NET
- 5. は、なぜ私はスタンフォードCoreNLP
- 6. スタンフォードCoreNLPトークナイザのオプションを設定する
- 7. スタンフォードCoreNLPシンプルAPIエラー
- 8. スタンフォードCoreNLPの使用
- 9. 作成したNERをスタンフォードCoreNLPにインポートするには?
- 10. スタンフォードcoreNLPスペイン語モデル/辞書を拡張するには
- 11. CorefResolution用スタンフォードCoreNLPの使用
- 12. スタンフォードCoreNLPと絵文字?
- 13. スタンフォードのStaggerDemoのcorenlpパッケージ
- 14. アラビア語のスタンフォードCoreNLPの例
- 15. スタンフォードCoreNLPとスタンフォードパーサーのMavenビルド
- 16. スタンフォードCoreNLP OpenIE注釈者
- 17. 「スタンフォード名義エンティティ認識」(CoreNLPではなく)で7クラスのNERを中国語で行う方法
- 18. トークンがリモートでユニークなアンドロイドデバイスを識別する方法
- 19. Web経由でスタンフォードCoreNLPを使用
- 20. スタンフォードcorenlpでcaseless NERモデルをトレーニング
- 21. スタンフォードCoreNLPが私のセンテンスをセグメント化するのを止めるにはどうすればいいですか
- 22. スタンフォードCoreNLP BasicPipelineExampleは機能しません
- 23. スタンフォードCoreNLPサーバのロギングを無効にする
- 24. 予想される識別子または '(' の前に '{' トークン
- 25. JavaでスタンフォードCoreNLPパッケージを使用してトリプルを抽出するには?
- 26. multithreadedlyスタンフォードCoreNLP Serverを実行して
- 27. スタンフォードCoreNLPを使用したセンチメント解析
- 28. スタンフォードCoreNLPを理解する任意のフレーズマッチングのTokensRegex構文
- 29. スタンフォードCoreNLPのエンティティ間の関係を抽出する
- 30. NLTKのスタンフォードCoreNLPカセレス分類器