NLTKのチャンクパーサーの正規表現は、POSタグと一致することができますが、特定の単語にも一致しますか?
したがって、名詞の後に動詞 "left"が続く構造体をチャンクしたいとします(このパターンをLと呼びます)。例えば、「\ DT dog \ NN left \ VB」という文章は、
(S(DT the)(L(NN dog)(VB left)))のようにチャンクされるべきですが、 NN slept \ VB "は全くチャンクされません。NLTKのチャンクパーサーと一致する単語
チャンク正規表現の構文でドキュメントを見つけることができず、私が見た例はすべてPOSタグと一致しています。
あなたはの線に沿って一例を提供することができます: chunkGram = R "" "チャンク:{? * * + }" "" –
ProfVersaggi