2017-01-19 1 views
0

私はClausIEを使用しており、Subject、動詞、およびオブジェクトのトリプルを文から返します。しかし、テキストが短いテキストであっても完全な文でなくても、これらは機能しません。私はちょうど短いテキスト/フレーズから主語動詞のペアを返すことができるライブラリまたは他のものがほしいです。ClausIE、Reverbなどと同じように、件名と動詞/関連の倍数を検索するための情報抽出はありますか?

例文は「提案32が受け入れられました」です。それは、いくつかの依存関係、あるいは「提案」という用語が主語であり、「受け入れられる」という用語が動詞/関係であることを識別するために使用されるルールを持つべきである。

私は上記のテキストのStanfordオンラインパーサーを試しましたが、テキストにオブジェクトがないために何も返されません。

アドバイスをいただければ幸いです。

答えて

0

問題は、Subject( "Proposal 32")とVerb( "accepted")があることです。あなたはオブジェクトを持っていないので、トリプルはありません。あなたは何ができるか

しかし、たとえば、オンライン

スタンフォードを使用して、トークン化を使用することにより、主語と動詞を特定しようとすることです:
- スタンフォードは、使用している場合、文はおそらく「宣言型」であります"S"タグ。
- 文が宣言的である場合、
- 主語は主動詞グループの前にある名詞グループです。スタンフォードのオンラインでは、最初のVPの前の最初のNPです。

今:あなたが:
- あなたが得る主動詞の前に "is"を追加します: "提案32は受け入れられます"。
- 「プロポーザル32 =受け入れ」とは、プログラミング言語が理解できる論理的な比較です。

問題はもちろん、これらの簡単な短い文章を取得するとは限りません。このアウト・オブ・ザ・ボックスを扱うことができるパッケージがいくつかあります。しかし、私が知っていることではありません。

できること:英語の文法に基づいて、独自のルールを作成します。それはあなたが作る規則の文章だけを理解するでしょう。しかし、それだけで必要なのは多分です。あなたがこれらの非常に短い組み合わせに対処する必要がある場合、いくつかのよく設計されたルールで仕事をすることができます

関連する問題