0
私の質問はこのquestionと似ています。 spacy
では、私は品詞タグ付けと名詞句識別を別々に行うことができます。名詞句チャンクによるPOSタグmergnig
import spacy
nlp = spacy.load('en')
sentence = 'For instance , consider one simple phenomena :
a question is typically followed by an answer ,
or some explicit statement of an inability or refusal to answer .'
token = nlp(sentence)
token_tag = [(word.text, word.pos_) for word in token]
出力は次のようになります。私はもしそこに思ったんだけど
[nc for nc in token.noun_chunks] # [instance, one simple phenomena, an answer, ...]
:名詞句またはチャンクについて
[('For', 'ADP'),
('instance', 'NOUN'),
(',', 'PUNCT'),
('consider', 'VERB'),
('one', 'NUM'),
('simple', 'ADJ'),
('phenomena', 'NOUN'),
...]
、私は次のように言葉の塊ですnoun_chunks
を得ることができますnoun_chunks
に基づいてPOSタグをクラスタ化する方法です。出力は次のようになります。
[('For', 'ADP'),
('instance', 'NOUN'), # or NOUN_CHUNKS
(',', 'PUNCT'),
('one simple phenomena', 'NOUN_CHUNKS'),
...]