2016-11-22 11 views
1

CoreNLPは、予想より多くのトリプルを返します。すなわち、センテンスによって伝達される基本情報または基​​本情報を構成する1つまたは2つのトリプルではなく、全体の文またはフレーズです。スタンフォードCoreNLPは基本リレーショントリプルよりも多くを返します

は、例えば、文の中:

「予備的な診断は、2011年11月11日の午前16時 CDTでロイ・コイMDで博士トムに通知されました。」

私たちは、これがトリプル期待

preliminary diagnosis; be notify to; Dr. Tom 

しかし、我々はこのようなトリプル得る:基本的な情報に加えて、追加の詳細情報が含まれている

1.0 diagnosis be notify by Roy Coy MD at 16:00 cdt on 11/11/2011 
1.0 diagnosis be notify to Dr. Tom at 16:00 cdt on 11/11/2011 
1.0 preliminary diagnosis be notify to Dr. Tom 

を。極端なケースでは、CoreNLPは原文全体を返します。

CoreNLPの出力を基本トリプルに減らすためにどのような議論をすることができますか?私たちは最大数の拘束と3倍の厳密なセットを試しましたが、動作しません。我々は、トリプルの完全なリストをファイルに提供することができます。

Javaコード:これは設計によって、実際に、ある

java -mx1g -cp stanford-openie.jar;stanford-openie-models.jar;slf4j-api.jar edu.stanford.nlp.naturalli.OpenIE -openie.max_entailments_per_clause= 1 -openie.triple.strict= true -openie.splitter.disable=true 
+0

ようこそスタックオーバーフロー!良い質問をするので、良い答えを得るためにあなたを助けるために私たちの[SO質問チェックリスト](http://meta.stackoverflow.com/questions/260648/stack-overflow-question-checklist)を確認してください。 –

答えて

0

。粒度のレベルの人々がOpenIEシステムから望んでいるものは常に先験的なものではないので、私たちのシステムは可能なすべての細かいレベルを生成しようとします。ここでの使用は、データベース内で参照できるトリプルを生成することです。したがって、誰かが非常に特定のクエリを要求すると、より長いトリプルが返されます。誰かが簡単な質問をすると、単純なトリプルが返されます(それに加えて長いトリプルもあります)。

関連する問題