2012-05-08 17 views
0

私は2つの従属する連続変数を持っています。それらの結合された値を使用して、3番目のバイナリ変数の値を予測したいと思います。値を離散化/分類するにはどうすればよいですか?私はクラスタリングアルゴリズムを探しているわけではありません。私は、ベイジアン分類子で後で使用できる「意味のある」離散カテゴリを得ることに特に関心があります。 論文、書籍、オンラインコースへのポインタは、すべて非常に感謝!連続データを分類するにはどうすればよいですか?

答えて

0

これは、機械学習の本質であり、最も研究された問題の1つです。

最小二乗回帰、ロジスティック回帰、SVM、ランダムフォレストは、このタイプの問題に広く使用されます。これは、バイナリ分類と呼ばれます。

実際にデータを分類することを目標にしている場合は、Scikitsのようにいくつかのライブラリが用意されています(Pythonで学ぶ、Javaでwekaなど)。彼らには素晴らしい文書があります。

しかし、機械学習の本質を理解したい場合は、機械学習リソースを検索するだけです(ここまたはGoogleで)。

+0

私は、一般的な分類ではなく、分類に関することがより明確になるように質問を編集しました。 – Ivana

0

もしあなたが本当のオタクになりたければ、可能な異なる離散化の集合を生成し、その上で分級器を訓練してから、その離散化を特徴で特徴づけし、その上で分級器を実行し、どのような離散化ベスト!?

一般的に、離散化する要素は、芸術であり、入力変数の範囲が何を意味するかをよく理解しています。

関連する問題