0
データは、テキストパラメータと整数パラメータで構成されています。問題は、両方のデータでマシンを鍛えることです。 Hashing Vectorizerは、テキストパラメータのトレーニングに使用されます。事前にPythonを使用してテキストデータと非テキストデータの両方に多項式naive bayesを使用するにはどうすればよいですか?
おかげで....
データは、テキストパラメータと整数パラメータで構成されています。問題は、両方のデータでマシンを鍛えることです。 Hashing Vectorizerは、テキストパラメータのトレーニングに使用されます。事前にPythonを使用してテキストデータと非テキストデータの両方に多項式naive bayesを使用するにはどうすればよいですか?
おかげで....
スリーはそれを行うには、いくつかの方法があります。
異なる分類子を使用するとより合理的であると考えられます。マルチノミナルNBは、フィーチャ間の相互作用をモデル化できません。しかし、あなたがMultinominalNB以外の何ものも望んでいなければ、あなたはそれを行うことができます。あなたはまた、次のことができます。
電車それらの2 - HVの1、整数の1、および出力weigth、または整数上のテキストと異なる分類器の
使用MultinominalNB、または
は、テキストにMultinominalNBを使用し、整数を両方ともフィーチャーとして出力します。