私はつぶやきをretweetedまたはretweetedとしてラベル付けしました。私は、ロジスティック回帰を使用して、つぶやきが返されるかどうかを予測するモデルを構築する必要があります。テキスト分類のテキストに複数の機能を使用するにはどうすればよいですか?
私が直面している問題は、ロジスティック回帰で複数の機能を使用する方法がわかりません。私が使用しなければならない機能は、tf-idf、lda、つぶやきがretweetされたかどうか、あるユーザからの何回のつぶやきが過去にretweetされたかです。
バイナリ分類で4つの機能を使用するにはどうすればよいですか?どんな助けでも大歓迎です。
scikit-learn、tensorflow ...)? 2つの機能を使用する手順は、4つの機能を使用する手順と同じですが、違いはありません。 –
scikit learn。私たちはどうやってそれについて行きますか?リファレンスチュートリアル –
あなたのデータセットの小さな例を共有できますか?私が助けることができるこの方法 –