2016-10-21 6 views
0

私はつぶやきをretweetedまたはretweetedとしてラベル付けしました。私は、ロジスティック回帰を使用して、つぶやきが返されるかどうかを予測するモデルを構築する必要があります。テキスト分類のテキストに複数の機能を使用するにはどうすればよいですか?

私が直面している問題は、ロジスティック回帰で複数の機能を使用する方法がわかりません。私が使用しなければならない機能は、tf-idf、lda、つぶやきがretweetされたかどうか、あるユーザからの何回のつぶやきが過去にretweetされたかです。

バイナリ分類で4つの機能を使用するにはどうすればよいですか?どんな助けでも大歓迎です。

+1

scikit-learn、tensorflow ...)? 2つの機能を使用する手順は、4つの機能を使用する手順と同じですが、違いはありません。 –

+0

scikit learn。私たちはどうやってそれについて行きますか?リファレンスチュートリアル –

+0

あなたのデータセットの小さな例を共有できますか?私が助けることができるこの方法 –

答えて

0

相続人は単なる一例clasiffierのデフォルトパラメータを使用して、考え方は同じ手順では、2を持っている場合に使用、またはされていることであるあなたはより多くの機能を持っている場合:あなたは(この問題のために使用しているツール

dataset = np.ndarray(shape=(num_rows,3),dtype=np.float32) ; 
retweeted_output = np.ndarray(shape=(num_rows,1),dtype=np.float32) 
#perform some actions to fill your data structures 
model = LogisticRegression(); 
model.fit(dataset,retweeted_output); 
+0

これは素晴らしいことです。どうもありがとう。 –

関連する問題