2016-03-24 9 views
2

ScikitのGridSearchは、最高のハイパーパラメータを探したいときに最適です。私は同じ考え方を使用して、複数の折れ線の目的関数を使って線形回帰のための最良のパラメータセットを見つけたいと考えています。線形回帰のパラメータ(文字通りベータとインターセプト)を複数のフォールドで最適化するにはどうすればよいですか?Scikitグリッドでパラメータを検索する(ハイパーパラメータではない)

ユースケース(簡体字):
私は、データの価値は3年を持っているデータセットを持っています。私は何が最良の線形回帰であるかを定義したいと思っています。私が線形回帰を完全なデータセットに適合させれば、私はすべてのデータの最小自乗誤差を減らすものを得るでしょう。効果的に私はこの(min(error)が)私の目的ではない、しかし、 enter image description here

の誤差を最小限に抑えることができます。 1年目と2年目に分類子がうまくやっていて、3年目を補うのに十分だったので、私はこの目的で良い結果を得ることができます。min(max(error_year_1, error_year_1, error_year_1))の線に沿って効果的に最小限に抑えたいものがあります。

これは、エラーの最大値を返す関数f(b0、b1、b2、year1、year2、year3)を作成し、その関数をscipyで最小化することです。

実際の質問:これをscikitで行う方法はありますか?

答えて

0

scikitはscoringへの直接アクセスしか提供していないようですが、これは一度に1つずつ表示されると思います。

ない非常に美しいが、私はあなたの最良の選択肢はGridSearchCVgrid_scores_cv_validation_scoresの上に行くと、手動で選択した損失関数の最大値を最小化するのparamsのセットをフェッチするためになると思います。

クラシファイアを保存するとは思わないでしょうが、それを使って予測を行う場合は、おそらく別のロジットを再トレーニングする必要があります。

関連する問題