出力yを与える一連の入力(x1、x2、...、xn)があるとします。目標はまだ見えなかったx1 ... xnの値からyを予測することです。この問題は機械学習の領域で回帰問題としてモデル化することができます。機械学習における連続回帰
ただし、データは引き続き送信されます。 x1 ... xnからyを予測することができます。さらに、その予測が良いかどうかを後で確認することができます。それが良いものだったなら、すべてが問題ありません。一方、予測が実数から大きく外れる場合は、モデルを更新したいと思います。私が見ることの1つの方法は、この新しいデータをトレーニングセットに挿入し、回帰アルゴリズムを再び訓練することです。それには2つの問題があります。まず、私のモジュールを時折ゼロから再計算する余裕があります。第二に、私はトレーニングデータにあまりにも多くのデータを持っているので、新しいデータは無視できるほどです。ただし、新しいデータは、問題の性質上、古いデータよりも多くのデータがインポートされる可能性があります。
古いデータよりも新しいデータに関連した一種の連続的な回帰を計算するのが良い解決策であるようです。私はそのようなアプローチを探しましたが、関連するものは何も見つかりませんでした。おそらく私は間違った方向を見ているでしょう。誰かがそれを行う方法の手掛かりを持っていますか?
サンプルウェイトを使用しているだけではありません(多くの[libs]でサポートされています(http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression 。フィット))? – sascha
それは "私のモジュールを時々スクラッチから再計算する余裕がある以上のコスト"に分類されませんか? –
あなたが解決したモデル*解決方法* *どのような種類のデータサイズ*を処理するか、重要な情報は与えられていません。 – sascha