私は2つの従属する連続変数を持っています。それらの結合された値を使用して、3番目のバイナリ変数の値を予測したいと思います。値を離散化/分類するにはどうすればよいですか?私はクラスタリングアルゴリズムを探しているわけではありません。私は、ベイジアン分類子で後で使用できる「意味のある」離散カテゴリを得ることに特に関心があります。 論文、書籍、オンラインコースへのポインタは、すべて非常に感謝!連続データを分類するにはどうすればよいですか?
0
A
答えて
0
これは、機械学習の本質であり、最も研究された問題の1つです。
最小二乗回帰、ロジスティック回帰、SVM、ランダムフォレストは、このタイプの問題に広く使用されます。これは、バイナリ分類と呼ばれます。
実際にデータを分類することを目標にしている場合は、Scikitsのようにいくつかのライブラリが用意されています(Pythonで学ぶ、Javaでwekaなど)。彼らには素晴らしい文書があります。
しかし、機械学習の本質を理解したい場合は、機械学習リソースを検索するだけです(ここまたはGoogleで)。
0
もしあなたが本当のオタクになりたければ、可能な異なる離散化の集合を生成し、その上で分級器を訓練してから、その離散化を特徴で特徴づけし、その上で分級器を実行し、どのような離散化ベスト!?
一般的に、離散化する要素は、芸術であり、入力変数の範囲が何を意味するかをよく理解しています。
関連する問題
- 1. sklearnのアンサンブル分類器でカスタム分類子を使用するにはどうすればよいですか?
- 2. ビニング結果を生データに適用するにはどうすればよいですか?連続変数を分類する
- 3. カテゴリのない散布図を非分類データでプロットするにはどうすればよいですか?
- 4. Doxygenでtypedefをどのように分類すればよいですか?
- 5. 年齢層に関心データを分類するにはどうすればよいですか?
- 6. cvs連続データセットから平均値/分を計算するにはどうすればよいですか?
- 7. コードを15分ごとに連続して実行するにはどうすればよいですか?
- 8. Nettyを使用してデータを連続的にストリーミングするにはどうすればよいですか?
- 9. pandasデータフレームの連続したデータ行をNaN行にフィルタリングするにはどうすればよいですか?
- 10. 次の分析でさらに分類を行うにはどうすればよいですか?
- 11. 連続データから近似値の中央値を求めるにはどうすればよいですか?
- 12. 連続したデータの分類
- 13. 連続アニメーションを作成するにはどうすればいいですか?
- 14. 連続データの送信中に遅延を減らすにはどうすればよいですか?
- 15. Matlabの熟練した分類器を使用してC++でデータを分類するにはどうすればよいですか?
- 16. 分類のルール/条件に関する一連のデータを確認するにはどうすればよいですか?
- 17. 深いネストされたオブジェクトを分類するにはどうすればよいですか?
- 18. SQLデータベースに送信されたアーティクルを分類するにはどうすればよいですか?
- 19. 関連モデルの関連モデルからDjangoデータを表示するにはどうすればよいですか?
- 20. カスタムアカウントの種類をAndroidの連絡先アプリに表示するにはどうすればよいですか?
- 21. SharePoint 2010 EditModePanelで正しい分類法コントロールを表示するにはどうすればよいですか?
- 22. バックグラウンドでmysqlデータをどのように分類し、分類するのですか?
- 23. 連続時間の長さに基づいてデータを分類する
- 24. Google Analyticsで仮想ページビューを分類するにはどうすればよいですか?
- 25. マルチラベル分類でF1測定値を計算するにはどうすればよいですか?
- 26. 分類学でカスタム投稿を取得するにはどうすればよいですか?
- 27. Androidでカレンダーの予定を分類するにはどうすればよいですか?
- 28. カスタム分類のテンプレートにdiff商品とサブカテゴリを表示するにはどうすればよいですか?
- 29. keras RNNをデータセットのテキスト分類に使用するにはどうすればよいですか?
- 30. TFS 2012のバグ以外にバグを分類するにはどうすればよいですか?
私は、一般的な分類ではなく、分類に関することがより明確になるように質問を編集しました。 – Ivana