2016-09-07 9 views
1

corenlpのシリアル化例外、それは時代のほとんどを正常に動作しますが、いくつかの時間シリアライザはバウンド例外の私に次のインデックスを与える:スタンフォードは私が/デシリアライズの注釈オブジェクトをシリアライズするStanfrod coreNLPのProtobufAnnotationSerializerを使用しています

java.lang.IndexOutOfBoundsException: Index: 44, Size: 36 
at java.util.ArrayList$SubList.rangeCheck(ArrayList.java:1217) 
at java.util.ArrayList$SubList.get(ArrayList.java:1034) 
at edu.stanford.nlp.pipeline.ProtobufAnnotationSerializer.fromProto(ProtobufAnnotationSerializer.java:1513) 
at edu.stanford.nlp.pipeline.ProtobufAnnotationSerializer.fromProto(ProtobufAnnotationSerializer.java:1588) 
at edu.stanford.nlp.pipeline.ProtobufAnnotationSerializer.fromProto(ProtobufAnnotationSerializer.java:1296) 
at edu.stanford.nlp.pipeline.ProtobufAnnotationSerializer.read(ProtobufAnnotationSerializer.java:186) 
at com.marca.nlp.relation.RelationDBDeser.main(RelationDBDeser.java:102) 

この例外のポップアップアップ頻繁に、私は見つけることができる明確な理由のために、ここに私のシリアル化/デシリアライズコードは次のとおりです。

シリアル化:

Properties props = new Properties(); 
    props.setProperty("annotators", "tokenize,ssplit, pos, lemma, ner, parse" 
      + ", depparse, mention, coref, natlog, openie, relation, sentiment"); 
    props.setProperty("openie.resolve_coref", "true"); 
    StanfordCoreNLP pipeline = new StanfordCoreNLP(props); 

    ProtobufAnnotationSerializer serializer = new ProtobufAnnotationSerializer(); 

    String docPath = "document.proto"; 
    try{ 

      Annotation document = new Annotation(input); 

      pipeline.annotate(document); 

      FileOutputStream fileOut = new FileOutputStream(docPath); 
      ObjectOutputStream out = new ObjectOutputStream(fileOut); 
      serializer.write(document, out); 
    } catch (Exception ex){ 
      ex.printStackTrace(); 
    } 

デシリアライズコード:

ProtobufAnnotationSerializer serializer = new ProtobufAnnotationSerializer(); 
    try{ 
     String docPath = "document.proto"; 
     FileInputStream fileIn = new FileInputStream(docPath); 
     ObjectInputStream in = new ObjectInputStream(fileIn); 

     Pair<Annotation, InputStream> docs = serializer.read(in); 
     Annotation document = docs.first(); 
    } catch(Exception ex){ 
     ex.printStackTrace(); 
    } 

私は、オブジェクトをデシリアライズするときに例外がポップアップし、ここで問題が発生するサンプルテキストです:。

アリス社のV CLS銀行インターナショナルはおよそ法的ケースでした米国最高裁判所が2014年に聴取した特許可能な主題(特許適格性)は、金融取引を円滑に進めるためのコンピュータ実装の電子エスクローサービスに関する特定のクレームが、特許保護の対象とならない抽象的なアイデアに関するものであるかどうかの問題を提示している。クレームが抽象的な考えに引き寄せられ、そのクレームをコンピュータ上で実装することは、その考えを特許可能な発明に変えるには不十分であったため、特許は無効とされた。これは、2010年にBilski v Kappos以来のソフトウェアの特許適格性に関する最初の最高裁判決であった。これは30年ぶりの事件であった。アリス・コーポレーション(以下「アリス」)は、支払いを交換する両当事者間の取引が「取引相手」または「決済」リスクを軽減する方法で第三者によって決済される金融取引システムの電子的方法およびコンピュータ・プログラムに関する4つの特許、または一方の当事者が実行し、他方の当事者は実行しないリスクがあります。 Alice氏の記述によると、CLS Bank InternationalとCLS Services Ltd.(以下「CLS Bank」と総称する)は2002年に同様の技術を使用し始めました.Alice氏はCLS BankにAliceの特許侵害の可能性を通知し、関連する特許請求はこれらの特許に記載されている.3つの後の特許はすべて、第1の継続出願および/または継続中の出願から得られる。完全な取引を確認する第三者の概念は、エスクローと呼ばれ、何千年もの間財務に使用されてきました。問題の特許は、エスクロー機能を汎用コンピュータがどのように実行できるかを説明しています。しかし、彼らはそのようなコンピュータがどのように動作するかを記述せず、ソースコードや仕様を含まなかった。 Australian Ian Shepherdは1999年に特許を取得し、Alice Corporationを設立して特許を取得しました。しかし、Aliceは、記載されているようなコンピュータシステムを製作したことはなく、また、その事業において特許を使用したことはありません。その結果、同社は特許トロールと呼ばれています。銀行のコンソーシアムであるCLSは、実際に毎日5兆ドルの取引を円滑にするために使用するコンピュータシステムを開発しました。米国の特許法は何かが特許を受ける前にいくつかの要件を定めています。 35 U.S.C.連邦特許法第101条は、抽象的なアイデアが暗黙的に失格とされ、自然と物理現象の法律に関する特許が禁じられていると解釈されています。 35 U.S.C. §102は、提出物が新規であることを要求し、先行技術として使用できるものの条件を設定する。 35 U.S.C. §103では、特許性のある主張が主題に精通している者には明らかであってはならないことを要求している。 35 U.S.C. §112では、特許を実装する主体に精通している人にとって、特許が明確かつ詳細でなければならないことが(他の中でも)要求されている。 Alice Corporationの特許は、これらのセクションのすべてで無効と主張されているが、主要な訴訟の焦点は第101条にあり、Aliceの特許は抽象的な発想を主張している。 2007年、CLS銀行は、アリスの特許が無効で強制力がなく、CLS Bankがそれらを侵害していないとの宣言的判決を求めて、コロンビア特別区地方裁判所にアリスを訴えました。アリスは特許を侵害してCLS Bankと闘った。裁判所は、CLS銀行の業務に関する質問とCLS銀行システムとの関係に関する最初の限定的な発見を認めた後、裁判所はサマリージャッジメントのための当事者の相互動議を裁定し、アリスの特許のそれぞれが無効であると宣言した35 USCの下で特許保護の対象とならない抽象的なアイデア§101.裁判所は、「リスクを最小化するために義務の同時交換を促進するための仲介者を採用するという抽象的な考えに向けられた」方法は、「基本的なビジネスまたは財務の概念」であり、 「抽象的な方法を実施することは、単に「電子的に」実施された抽象的な方法よりも特許性がない」と述べた。地裁の裁判官は、Bilski v Kapposの判例を前例とし、2010年最高裁判所は、商品市場における取引は、リスクに対するヘッジという抽象的な考え方をカバーしていたため、特許適格ではなかった。ビルスキの場合、最高裁判所は、そのような主張を許可することは、あらゆる分野においてリスクヘッジの使用を先取りし、抽象的なアイデアに対して独占権を付与すると述べていた。アリスはその決定を訴え、その事件は連邦巡回控訴裁判所に提出された。控訴裁判所の審理委員会は、2012年7月に下院の判決を取り下げるために2-1で決定した。パネルは、主張が抽象的なアイデアに関するものであることが "明白に"明らかでない限り、Aliceのようなコンピュータ実装の発明が第101条の下で特許適格であると主張した。 「最も合理的な単一の理解は、クレームが基本的な真実または脱着した概念にすぎず、その考えを特定のアプリケーションに付けるクレームに制限はありません」CLS Bankは同じ連邦巡回裁判所に、エンハンシャルリハーサル。裁判所は、以下の質問を決定するために、控訴を認め、以前のパネルの決定を退去させた。コンピュータで実施された発明が特許不適格抽象的な考えであるかどうかを判断するために、クレーム中のコンピュータの存在が特許不適格の対象を特許可能にすることができるかどうか。方法、システム、メディアの主張は101条で同等と見なされるべきかどうか.10人の裁判官からなる破局パネルは7つの異なる意見を出し、大多数が支持した意見はない。 10人の裁判官のうち7人は、アリスの方法請求およびコンピュータ可読媒体の請求が特許適格ではないという地裁の決定を支持したが、相反し合っていない理由でこれを行った。 10人の裁判官のうち5人は、アリスのコンピュータシステムクレームが特許適格ではないという地裁の決定を支持した。パネルは、コンピュータで実施された発明が特許不適格で抽象的なアイデアであるかどうかを判断するための基準に合意しなかった。 Circuit Judge Dyk、Prost、Reyna、Wallachに加わったCircuit Judge Lourieによる5人の同意意見の中で、複数の裁判所が抽象的なアイデアや基本概念を最初に特定することに焦点を当てた特許適格性の分析を明言したクレームによって適用され、クレームが抽象的なアイディアを先取りするかどうかを決定すること。 Lourieの意見は、「人的貢献」に関して、4つの質問を指摘した。これは潜在的に主観的な要因であり、特許適格性に重きを置いている。Lourie分析は最高裁判決で3つの共通テーマによって枠組みされている。 Circuit Judge Linn、Moore、O'Malleyは部分的に同意し、部分的に異議を申し立てる意見書を提出し、主張が全体として抽象的なアイデアの適用に限定されているかどうかを判断することに焦点を当てた特許適格性分析を明言し、または単に抽象的なアイデアを暗唱しただけだった。 Raderのアプローチの下では、システムの主張はコンピュータで実装されたアプリケーションに限定されていたため、Aliceの特許は特許適格とされていたはずです。 Rader判事は、101条の下で非常に広範な特許性を認めているとの法律の読み方と、自然法則は「もしあれば作成された普遍的定数」に限定されているという彼の理解を表す判決(他の判事に署名されていない)神、ビシュヌ、アッラーのみによって」アインシュタインを参照して、彼は "重力でさえも自然の法則ではない"と述べている。回路評論家キンバリー・アン・ムーア(Kimberly Ann Moore)は部分的に異議を唱え、部分的に意見の矛盾した意見を提出した。これには、Raderの長所裁判官LinnとO'Malleyが加わった。 Aliceのコンピュータシステムの主張は、特許適格と判断されていたはずです。「システムクレームを含むこれらの請求のすべてが特許適格でない場合、すべてのビジネス方法、金融システム、ソフトウェア特許、および多くのコンピュータを含む数十万件の特許が死亡したとの見解で、実装された電気通信特許。ニューマン巡回裁判官は、連邦巡回控訴裁判所に対し、第101条の解釈を明確にするよう、3つの基本原則、すなわち§101が特許可能な主題の包括的陳述であること、特許請求の範囲は特許適格性には関連しておらず、特許主題を改善または構築し、代替案と比較したり、そのメカニズムを理解したり、特許不適格ではない。 Circuit Judge LinnとO'Malleyは、手続き上の理由から、下級裁判所を取り消すべきであり、すべての請求が特許適格であるとの意見が異議を申し立てた。この意見は、コンピュータシステムクレームに関するRaderの意見に同意したが、Rader分析をすべてのクレームに適用し、すべてのクレームが上昇または下落していたであろう。この意見は、多くのamicus curiae briefsに引用されている「低品質ソフトウェア特許の拡散と積極的な実施」に取り組むための司法的ではなく立法的な行動を求め、ソフトウェア特許の期間を制限する、または特許の範囲を制限する法律を提案した機能的な主張。米国最高裁判所は、「システムと機械、プロセス、および製造品への請求を含む、コンピュータ実装された発明に対するクレームが、 35 USC§101の意味の範囲内にある適格な主題。この分割論点におけるソフトウェア産業と特許専門家の深い関心は、電子フロンティア財団、ソフトウェアフリーダム法などを含めて、この問題を決定する最高裁判所に要請した司法報告書を提出した企業や団体の数に明らかであるセンター、電気電子技術者協会、シカゴ知的財産法律協会、アクセンチュアグローバルサービス。そのようなブリーフィングのほとんどは、特許を無効にすべきだと主張していたが、彼らはその理由について意見を異にした。 Google、Amazonなどの企業が作成した簡単な説明では、この特許は抽象的なアイデアであり、実際にはイノベーションに害を及ぼしていると主張しています。マイクロソフト、アドビ、ヒューレット・パッカードは、それがビンツキー・カッポス(Bilski v Kappos)の特許のないビジネス方法であり、単にコンピュータでそれを実行すると言っているだけで、この事実は変わらないと主張している。 Linkedin、Netflixなどと、フリーソフトウェア財団などの別のブリーフは、革新と科学的コラボレーションを阻止するため、ソフトウェアを特許化してはならないと主張した。 IBMは「抽象的な発想」の考え方に同意せず、あまりにも明白であるために特許を無効にするべきだと主張した。最後に、DillardとHasbroを含む小売業者と製造業者のコンソーシアムは、単に明確なルールを求めました。裁判所は2014年3月31日に口頭弁論を聞き、2014年6月19日に判決を下した。アリス社の申し立てはシドレー・オースティンのカーター・G・フィリップス氏であり、CLS銀行はマーク・ペリー、Dunn & Crutcher。裁判所は、amicus curiae briefsを提出した者と合意し、満場一致で特許を無効にした。ワシントンポスト紙によると、「裁判所は、普遍的に悪い特許と言われていたものを打ち破ったが、どのような種類のソフトウェアが特許可能でなければならないかについてはほとんど言及していない。他の、将来のケースのための指針を提供することを多かれ少なかれ落ちた」と述べた。電子フロンティア財団は、最高裁判所が「一般的なコンピュータ機能を実行する汎用コンピュータを追加するだけでは、それ以外の抽象的な考え方を特許可能にすることはできないということを再確認した」と述べた。確かに、最高裁判所は、特許が抽象的なアイデアを主張するときの明確な指針を提供していないが、一部の特許を無効にする助けとなるガイダンスを提供したより厳格なソフトウェア特許がある」と語った。ソフトウェアフリーダム法センターは、最高裁判所が「ソフトウェア発明に関する特許の廃止に一歩踏み出した」と述べ、従来の立場を支持して、抽象的なアイデアやアルゴリズムは特許性がないと主張した。抽象的なアイデアを適用する...指定されていない汎用コンピュータを使用する。"特許改革立法を支持する特許公平連合は、「裁判所や執行部の判決は、特許トロールのビジネスモデルを不採算にするために必要なことを行うことも、いくつかのコメンテーターは、抽象的なアイデアと特許適格なアイデアの実現の境界をより包括的に定義できなかったという意見に失望していたが、トーマス・ジャーナルの声明に特に批判的であった - "いずれにせよ、この場合の「抽象的なアイデア」カテゴリの正確な輪郭。 Bilskiにおけるリスクヘッジの概念と、ここで問題となっている中間的な決済の概念との間に意味のある区別がないことを認識すれば十分である。例えば、マージーズ教授は、「答えが得られなかったということは、私たちが得た無回答の深さを逃すことだ」と言った。 Duffy教授は、「最高裁判所は、この分野で明確な指針を提供することに著しく抵抗しており、その傾向は続いている」と述べた。おそらく最も怒っていたのは、Law Comicsであり、Thomas Justice氏は、彼の意見が「ソフトウェアを取り巻く厄介で挑戦的な問題に積極的に取り組んだ」と主張し、ソフトウェアのパテント化について「特に有用ではない」決定であったと主張している。一方、スターン教授は、全員一致の意見の「感知された合法性と先行的安定性」は、不十分であることの欠点を「均衡させる」と主張して、「9人の仲裁廷における全会一致の予想価格クリアGUI詳細についてはダンス。このコメンテーターは、「ソフトウェア特許の適格性に関する細かい裁定を行うことは賢明だ」と主張した。現時点では、非常に広い意味で自信を持って話すことができるということはあまり知られていないからである。

私はStanford CoreNLPを使用しています。3.6.0 ご意見はありますか?

答えて

0

うん、私はバグを複製しました。ここでの問題は-openie.resolve_corefフラグです。 OpenIEによって生成された関係は、元のドキュメントのCoreLabelsを指し示すことになります。つまり、デシリアライザは、トリプルの原型と非直列化された文からトリプルリレーションを再構築します。トリプル内のすべてのトークンが直列化されていない文章になっているので、これは通常OKです。もちろん、corefを使用することで、ドキュメント内の他の場所でトークンを参照できるようになりました。したがって、範囲外の例外をインデックスします。

修正がプッシュされました。すぐにGitHubに表示されるはずです。新しいコードは元のprotoファイルが変更されたので、古いproto形式で保存されたリレーショントリプルをデシリアライズしなくなります。

関連する問題