1

単純な線形回帰を使用する住宅価格を予測する既存のモデルがあります。入力として私は日付と出力が価格です。単純な線形回帰の方が多変量/複数回よりも良い結果

全体的な結果を改善したいので、もう1つの機能を追加しました。新しい機能は、推定されたプロパティからの距離です。

問題は、複数/多変量回帰が単純回帰よりも少し悪いことです。 (すべてのデータは正規化されています)

なぜこのようなことが起こり、どのように私はこれにアプローチできますか?

答えて

1

だけで一覧表示するには、考えられる理由の数十がありますいくつか:

  • 新しい機能がやっとあなたが予測しようとしているものと相関している場合 - あなたが効率的に、より良い期待することはできませんので、システムにノイズを注入されていますパフォーマンス
  • あなたは非常に少数のデータポイントを持っている場合は、線形モデルを使用しているので、より多くの機能が新機能は非常に良い予測因子であるが、その関係は従属にを線形ではない場合でも、はるかに困難な問題
  • につながることができます変数 - モデルは失敗するこのように非常に単純なモデルであるとして(それが悪いの機能をよりよく扱っているので、特に投げ縄)、でも尾根/なげなわ回帰が完全に結果を変えるかもしれないだけでなく
  • 線形回帰ね
関連する問題