2013-02-25 12 views
16

Javaの結果 - opennlpopennlpのチャンカとpostagは

私はopennlpに新しいですし、私は文を分析し、ポストタグとチャンクの結果を持ってしようとしていますが、私は意味の値を理解することができませんでした。投稿タグとチャンクの結果の値が完全な形式の意味を説明できるテーブルはありますか?

Tokens: [My, name, is, Chris, corrale, and, I, live, in, Philadelphia, USA, .] 
Post Tags: [PRP$, NN, VBZ, NNP, NN, CC, PRP, VBP, IN, NNP, NNP, .] 
chunk Result: [B-NP, I-NP, B-VP, B-NP, I-NP, O, B-NP, B-VP, B-PP, B-NP, I-NP, O] 

答えて

12

POSタグはPenn Treebank tagsetです。チャンクは、名詞句(NP)、動詞句(VP)、および前置詞(PP)です。 「B- ..」はそのようなフレーズの先頭を示し、「I- ..」は「内部」のようなものを意味し、フレーズはここに続きます(OpenNLP docs参照)。

10

S - >単純宣言句、 (可能空)によって導入されていない、すなわち1 組み合わせ又はWH-ワードを従属し、それは被験者動詞 反転を示しません。

SBAR - >(おそらく空の)従属接続詞によって導入された句。

SBARQ - > wh-単語またはwh-フレーズによって直接の質問が導入されました。 間接的な質問と関連句は、SBARQではなく、 SBARとして括弧で囲む必要があります。

SINV - >反転した宣言文、すなわち被験者 がテンポド動詞またはモーダルに従うもの。

SQ->逆質問があるかどうか、または質問のメイン句が逆の場合は、 のSBARQのwh-フレーズに従います。

ADJP - >形容詞フレーズ。

ADVP - >副詞フレーズ。

CONJP - > Conjunction Phrase。

FRAG - >フラグメント。

INTJ→Interjection。品詞タグ UHにほぼ対応します。

LST - >リストマーカー。周囲の句読点を含みます。

NAC - >構成要素ではありません。 NP内の特定のプレミアナル 修飾子の範囲を示すために使用されます。

NP - >名詞句。

NX - >特定の複合NP内でNPの先頭をマークするために使用されます。 Nバーに非常におおよそ対応します

PP - >前置詞の句です。

PRN - >括弧書き。

PRT - >パーティクル。 RPにタグ付けする必要がある単語のカテゴリ。

QP - >定量語フレーズ(すなわち、複合小節/量フレーズ)。 NPで使用されています。

RRC - >縮小相対節。

UCP - > Coordinated Phraseと異なります。

VP - >動詞フレーズ。

WHADJP - > Wh-形容詞フレーズ。どのように暑いの として、wh副詞を含む形容詞句。

WHAVP - > Wh-副詞フレーズ。 NPギャップを持つ節を導入します。 NULL (0補完子を含む) または語彙、whや副詞(howやwhyなど)を含むことがあります。

WHNP-> Wh-名詞句。 NPギャップを持つ節を導入します。 nullの場合があります。 (0の補数を含む) またはレキシカルです。 who、どの本、その 娘、どれも、またはどのように 多くのヒョウ。

WHPP - > Wh-前置詞フレーズ。フレーズ フレーズ (その権限またはその権限など)を含む前置詞フレーズ。 PPギャップを導入するか、またはWHNPに含まれています。

X - >不明、不確かな、または解体不能です。 Xは多くの場合、ブラケットには タイプミス、ブラケットには ... the-constructionsが使用されます。

クレジット:http://mail-archives.apache.org/mod_mbox/opennlp-users/201402.mbox/%[email protected].com%3E

2

タグの詳細情報を取得するためにPOSTag listを参照してください。
最初の部分:「B-NP」等

チャンクタグは、2つのまたは3つの部分から構成されているチャンクとして

B - marks the beginning of a chunk 
I - marks the continuation of a chunk 
E - marks the end of a chunk 

、そのような(長い1つの単語だけであってもよいです上記の例では "She")、同時にチャンクの開始と終了の両方を行うことができます。

第二の部分

NP - noun chunk 
VP - verb chunk 

以上の基準についてあなたはOpenNLP Documentationを参照することができます。

関連する問題