NLKTが望む情報を抽出する方法

いくつかのトピックに関する関連情報を抽出したいと思います。例えば：NLKTが望む情報を抽出する方法

最初のステップで、家族や友人

の顧客

勧告の製品情報

の購入経験は、私は、ウェブサイトのいずれかから情報を抽出します。例えば：

私は、企業が最も重要なcomparisonand私の比較ととしてAIAは、より多くの、より良い生命保険をすると思う私のopinionyesにも医療保険であるuは彼らの任務であることを計画して販売するいくつかの薬があります高...ダンは企業から保険を購入することを心配しています何が起こっても、会社に連絡することができます...より良い信頼できるだけでなく、委託のために働いている代理店を見つける今のところ、将来的に... thanksregardsdiana ""

次にVS2015でNLTKを使用して、単語を分割しようとしました。 pos_tagを使用することにより

toks = nltk.word_tokenize(text)

私は私が何をすべきかわからない、この部分から

postoks = nltk.tag.pos_tag(toks)

私TOKSにタグを付けることができますか？以前は、IBM text Analyticを使用しました。このソフトウェアでは辞書を作成してパターンを作成し、データを分析します。辞書の

サンプル：インスタンスためinsurance_cmp：{AIA、IMG、SABB}パターンの

サンプル：

insurance_cmp + Good_Feeling_Pattern

insurance_cmp + [ '購入|購入' ] + Bad_Feeling_Pattern

Good_Feeling_Pattern = [いいね、それなりにいい]
は
Bad_Feeling_Pattern = [悪い、悪いことに、良いではない、後悔]

私はNLKTで同じことをシミュレートすることができ、私は知っているしてみましたか？チャンクと文法を作成すると、私が探しているものを抽出するのに役立ちますか？私はあなた自身を改善するためにあなたの考えを持っていてもいいですか？

grammar = r""" 
    NBAR: 
     {<NN.*|JJ>*<NN.*>} # Nouns and Adjectives, terminated with Nouns 

    NP: 
     {<NBAR>} 
     {<NBAR><IN><NBAR>} # Above, connected with in/of/etc... 
""" 
chunker = nltk.RegexpParser(grammar) 

tree = chunker.parse(postoks)

私の目標に到達するための私の次のステップができたら助けてください。

出典

2016-06-15 Amir

あなただけのこれらのvideo

に従うか、このblogを読む必要があります。

出典

2016-06-29 10:07:31 Amir

NLKTが望む情報を抽出する方法

答えて

関連する問題