0

特定の時点で切断される予定のケーブル加入者数を予測する予測システムを構築しています。私はPythonを使用していて、私が試したさまざまなモデルから、XGBoostが最高の性能を発揮します。Xgboost予測モデルの休暇期間がありません

私は、実際のものが使い果たされ、私の遅れで予測された数字を使い始めるなど、動いている窓の仕方で動作する自己参照システムを用意しています。

予測システムを構築するために、以前の800日間のラグ(1日の切断)、移動平均、比率、季節性、年、月、日、週などの指標を使用しました。ちょっと混乱した。当初、私はすべての種類の休日を示すためにただ1つの列を使用しましたが、後で別々の休日が異なる影響を与えるかもしれないことを理解しました(いくつかの休日は高い売上高を引き起こし、私はまた、感謝祭、年末年始などのお祝い期間を示す「季節」の列を追加しました。

多くの休日関連の列を追加した後でも、私は大部分感謝祭と新年の期間を欠場する。それはある程度の休日を世話しますが、それは完全にスパイクを逃します。そしてチャートからわかるように、スパイクは傾向であり、毎年(オレンジ色)に現れます。私の予測(灰色)は、17日の休暇に取り組んでいますが、予測の下では、それがどう処理されるかについての考えはありません。 enter image description here

p.s.私はgridsearchを使用してxgboostハイパーパラメータをチューニングしました

答えて

0

あなたがデータを消去してアウトライアを取り除いた場合、モデルはより安定した予測セットを全体的に提供しますが、

データを消去した場合は、スレッショルドを使用してプレーします。より広いスパイクを予測する機能との平日誤差のバランスがより広いかどうかを確認してください。

関連する問題