NOテキスト分類のNaive Bayes分類

-2

テキスト文書のための特徴空間のモデリングは非常に簡単です。
たとえば、テキスト（トレーニングデータ）のすべての単語をフィーチャとして使用できます。
特定の単語（例：「犬」）が（分類された）トレーニング例（スパムとして分類されているなど）で複数回出会う場合は、この単語を使用して新しいデータを分類できます。NOテキスト分類のNaive Bayes分類

私の機能をモデル化するにはどうすればいいですか？
私の場合、名前、年齢、家族のサイズなどの機能があります。
私は、私の特徴ベクトルのすべての可能な年齢について記入するのが正しい方法ではないと思います。
人間が100歳までに死亡したと仮定すると、私の年齢機能のために100桁の数字しか持たないでしょう。
私はデータのビニングについて考えました：おそらく1〜20、21〜40、41〜60のフィーチャ「年齢」を区切ります...
30歳の人をモデル化するには、現在の数字（01000）。

これらのような機能をモデル化する方法はありますか？

出典

2016-10-13 Lisa

answer1 answer2が見つかりました。したがって、データビニングを使用するか、連続フィーチャに適合する（通常の）分布を使用してフィーチャをモデル化できます。

出典

2016-10-13 10:26:25 Lisa

NOテキスト分類のNaive Bayes分類

答えて

関連する問題