2017-03-29 6 views
0

私はcsvファイルのいくつかのデータを睡眠に費やした時間、働く時間などのデータを持っています。また、私が試験を受けているかどうかなどのバイナリ・データもあります。これらのすべてのデータを使って、今日テレビを見ていた時間を予測しようとしています。問題は、私がWEKAのアルゴリズムや方法が最善であるかどうかについてはあまりよく分かりません。私は数値を予測しようとしているので、数字の変数とバイナリの変数があります....私はどんな助けにも感謝しています!ベスト・アルゴリズムを選択する際のWekaエクササイズ

答えて

0

1つの方法として、この回帰問題を分類問題に含めることができます。つまり、30分間隔で増分することができます。

この回帰で予想される精度の高さは、テレビの10分とテレビの11分を区別できるように分類器に意味がありますか?それがあなたのアプリケーションに依存していないと仮定した場合でも、それは再度の場合です。

また、いくつのデータインスタンスがありますか?そして、データセットはどのように変化していますか?私は単純なNaive Bayesクラシファイアを最初に使用することをお勧めします。なぜなら、あまり適合しないため、ランダムフォレスト(データの量が少ない場合)よりも優先順位が高いからです。

関連する問題