私はCoreNLPサーバーをセットアップし、Stanford NERを使用して文章の期間を抽出しています。なぜスタンフォードNERのデモは、今年の「2017年」をCoreNLPサーバーに変換しないのですか?
私が文
解析するcorenlp.runオンラインでインタラクティブなデモを使用する場合は「何かが起きた昨年を」。
it shows 'DATE' and '2016'。 しかし、自分のサーバーは、CoreNLPの最新リリースであるonly shows 'DATE'を設定しました。さらに、Python Requestを使用してサーバーのAPIに同じ文を照会すると、応答の最初の2つのトークンには、フィールド'timex': {'type': 'DATE','tid': 't1', 'altValue': 'THIS P1Y OFFSET P-1Y'}
と'normalizedNER': 'THIS P1Y OFFSET P-1Y'
が含まれています。
私の出力がデモのものほど良くないという事実に対処する必要があるのであれば、normalizedNER
フィールドで何が得られる可能性があるのか、またはTHIS P1Y OFFSET P-1Y
の意味を説明するStanford NERまたはtimex3ドキュメントはどこですか? ?ここで
は、私はあなたが実行しているときdocDate
として現在の日付を使用するようにパイプラインを伝えることを可能にする新機能を追加しましたHi、これはあなたの問題の主な情報源である全体のAPIレスポンス
[
{'word': 'Last', 'after': ' ', 'originalText': 'Last', 'timex': {'type': 'DATE', 'tid': 't1', 'altValue': 'THIS P1Y OFFSET P-1Y'}, 'pos': 'JJ', 'ner': 'DATE', 'lemma': 'last', 'normalizedNER': 'THIS P1Y OFFSET P-1Y', 'before': '', 'index': 1, 'characterOffsetBegin': 0, 'characterOffsetEnd': 4},
{'word': 'year', 'after': ' ', 'originalText': 'year', 'timex': {'type': 'DATE', 'tid': 't1', 'altValue': 'THIS P1Y OFFSET P-1Y'}, 'pos': 'NN', 'ner': 'DATE', 'lemma': 'year', 'normalizedNER': 'THIS P1Y OFFSET P-1Y', 'before': ' ', 'index': 2, 'characterOffsetBegin': 5, 'characterOffsetEnd': 9},
{'word': 'something', 'before': ' ', 'originalText': 'something', 'ner': 'O', 'lemma': 'something', 'after': ' ', 'characterOffsetEnd': 19, 'index': 3, 'characterOffsetBegin': 10, 'pos': 'NN'},
{'word': 'happened', 'before': ' ', 'originalText': 'happened', 'ner': 'O', 'lemma': 'happen', 'after': '', 'characterOffsetEnd': 28, 'index': 4, 'characterOffsetBegin': 20, 'pos': 'VBD'},
{'word': '.', 'before': '', 'originalText': '.', 'ner': 'O', 'lemma': '.', 'after': '', 'characterOffsetEnd': 29, 'index': 5, 'characterOffsetBegin': 28, 'pos': '.'}
]
[この](https://stackoverflow.com/questions/39325657/why-does-normalizedner-for-dates-in-my-local-standford-corenlp-server-doesnt-di)が役に立つかもしれません。 –