2017-06-01 12 views
1

NLTK Regex構文解析の仕組みを理解できません。 下記を参照してください。分かりませんNLTK正規表現の解析形式

parser = RegexpParser(''' 
    NP: {<DT>? <JJ>* <NN>*} # NP 
    P: {<IN>}   # Preposition 
    V: {<V.*>}   # Verb 
    PP: {<P> <NP>}  # PP -> P NP 
    VP: {<V> <NP|PP>*} # VP -> V (NP|PP)* 
    ''') 

<DT>?とは何ですか?分詞(光沢略称PTCP)動詞の形態である - DTのような判定である

<V>.*

答えて

4

<V.*>

おかげとの差が、、...

動詞分詞のdefintionはいただきまし 名詞、名詞句、動詞、動詞句を変更するために文章で使用され、形容詞や副詞に似た役割を果たします。 ...これは、非限定動詞形式の1つです。

<V>.* is for verb participle example : drawn sword (drawn is vp) 
<V.*> is a verb    example :going , go 

あなたがここではそれらについての詳細を見つけることができます。 https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html

*何を意味するのでしょうか?これは正規表現で使用されるものと同じです。 *任意の文字セット(*を構成する文字の集合勿論の組み合わせに意味を持たなければならない)である

のは、いくつかの例に行こう -

<V.*> A verb followed by anything in the same run like go(ing) mov(ing) 
+0

おかげSatyadev。しかし、例えばどうすればよいでしょう:動詞とその間の任意の数の単語とを一致させ、名詞で終わらせたい。どうやってするか? それは 'です。* ' – Ming

+0

ちょっと、そうだね – Satyadev