評判分析の共同リスト今私は、たとえば、処理速度を向上させるために、言葉の見出し語処理を行うためにNLTKを使用していscikit-学ぶのpythonと評判分析をやって

イム、：評判分析の共同リスト今私は、たとえば、処理速度を向上させるために、言葉の見出し語処理を行うためにNLTKを使用していscikit-学ぶのpythonと評判分析をやって

私は後に次の配列を取得しますNLTK処理：

array([ ['Really', 'a', 'terrible', 'course', u'lecture', u'be', 'so', 'boring', 'i', u'contemplate', 'suicide', 'on', 'numerous', u'occasion', 'and', 'the', 'tutes', u'go', 'for', 'two', u'hour', 'and', u'be', 'completely'], ['Management', 'accounting', u'require', 'sufficient', 'practice', 'to', 'get', 'a', 'hang', 'of', 'Made', 'easier', 'with', 'a', 'great', 'lecturer']], dtype=object)

しかしscklearnは、配列が

array([ 'Really a terrible course lectures were so boring i contemplated suicide on numerous occasions and the tutes went for two hours and were completely ', 'Management accounting requires sufficient practice to get a hang of Made easier with a great lecturer '],dtype=object)

ので、右のフォームに、この配列を変換するための最良の方法は何である必要が？あなたはどうしたら私はjoint listを使用しようとするが、結果は

出典

2016-10-05 C. Gary

奇妙です：

second_array = [' '.join(each) for each in first_array]

代わりにあなたは自分のトークンを使用するsklearn.CountVectorizerを伝えることができます。

vect = CountVectorizer(preprocessor=lambda x: x, tokenizer=lambda x: x) 
X = vect.fit_transform(first_array)

出典

2016-10-05 09:12:24 elyase

素晴らしいです！本当にありがとう –

評判分析の共同リスト今私は、たとえば、処理速度を向上させるために、言葉の見出し語処理を行うためにNLTKを使用していscikit-学ぶのpythonと評判分析をやって

答えて

関連する問題