NLTKの正規表現パーサーで文法の一部としてnot条件を作成する必要があります。私は構造'Coffee & Tea'である単語をチャンクしたいですが、シーケンスの前にタイプ<IN>の単語があれば、それはチャンクしてはいけません。たとえば、'in London and Paris'はパーサによってチャンクされるべきではありません。次のように 私のコードは次のとおりです。 grammar = r'''
テキストから情報を抽出しようとしていますが、NLTKチャンクを使用しています。ここで が The stocks show 67% rise, last year it was 12% fall私は 67% riseと上記の文をタグ付け12% fall POSをキャプチャしたい 今すぐ ('The', 'DT'), ('stocks', 'NNS'), ('show', 'VBP'), ('67',