2016-05-07 5 views
0

私はPython言語を使用しており、私はtwitterからつぶやきを得ました。次に、私がしたいことは、そのようなつぶやきの機能から特徴を抽出することです: 1.特集A(統計的な機能):つぶやきメッセージの単語の数と、つぶやき内のクエリ単語の位置。 2.機能B(キーワード機能):ツイートの単語。 3.機能C(単語コンテキスト機能):クエリワードの前後のワード。例えば : フィーチャーA:つぶやき中7ワード、クエリ単語は 機能B第五次のとおりです。私は、日本で、午前、右、今 フィーチャーC:日本、右 つぶやきからの特徴抽出

を抽出するために私にいくつかの良い方法を提案しますそれらの特徴。私は機能

答えて

0

あなたは次のライブラリになりますを抽出するための正しい方法を取得していない午前通り:あなたは、成し遂げるために必要なものに応じて

  1. NLTK
  2. SKLearn

これらの2つの間のミックスは、あなたに長い道のりを与えることができます。

また、自然言語処理の紹介については、私はthis book(無料で読むことができます)をお勧めします。

+0

ありがとう@lesingerouge – SmartF

関連する問題