2017-01-20 16 views
1

私は、約4年の異なる支店の銀行データを持っています。私は毎日と時間単位で行の数を予測しようとしています。私は重要な機能としてissue_datetime(年、月、日、時)を持っています。グラフラボを使って異なる回帰手法(線形、意思決定木、ランダムフォレスト、xgb)を適用しましたが、精度は向上しませんでした。 私はまた、過去のデータに基づいて閾値を設定することを考えていました。これは、異常値を除去した後の日々、月ごとのレベルの平均を取って、それを閾値として設定することです。 最良のアプローチは何ですか?機械学習を使用して行数を予測する

+3

「最善のアプローチは何ですか?」には意味がありません。誰かがしようとしても、その答えは非常に投機的なものになるでしょう。すべてのすべてのオフトピックのstackoverflow。 – cel

+0

私は@celに同意します。しかし、私はあなたの季節のパターンを取り除こうとする予測をしようとする前に、あなたの予測を改善するのに役立つかもしれないと思います。 – Shobeir

+0

私はこのタスクを達成するための他の方法があるのと同様に、提案にもオープンしていますか? – user1584253

答えて

1

1d時系列データがあるので、データをグラフ化して面白いパターンを探すのは比較的簡単です。

データに非定常的な側面があることを確認すると、おそらく最初にチェックアウトしたいモデルのクラスは、おそらく季節的な追加を伴う自動回帰モデルです。 ARIMAモデルは、時系列データのかなりの標準です。 http://www.seanabu.com/2016/03/22/time-series-seasonal-ARIMA-model-in-python/

関連する問題