いくつかのnlpテクニックを使用して、以下のテキスト行でコースを検索しようとしています。こののプットアウトnlpを使用してテキストを識別する
from nltk import word_tokenize, pos_tag, ne_chunk
sentence = "SDGI is offering courses like Electronics,Mechatronics, Physics,Mechanical Engineering"
print ne_chunk(pos_tag(word_tokenize(sentence)))
は
(S
(ORGANIZATION SDGI/NNP)
is/VBZ
offering/VBG
courses/NNS
like/IN
Electronics/NNS
,/,
Mechatronics/NNS
,/,
(PERSON Physics/NNPS)
,/,
(PERSON Mechanical/NNP Engineering/NNP))
である私はライン上からコースを抽出することができます方法はありますか?
実際のプロジェクトでは、私はコース名を取得する必要があるので、非常に多くのドキュメントを取得します。
ご協力いただきましてありがとうございます。