のは、私のようなテーブルがあると仮定しましょう:R - 推定欠損値
Date Sales
09/01/2017 9000
09/02/2017 12000
09/03/2017 0
09/04/2017 11000
09/05/2017 14400
09/06/2017 0
09/07/2017 0
09/08/2017 21000
09/09/2017 15000
09/10/2017 23100
09/11/2017 0
09/12/2017 32000
09/13/2017 8000
表中の値は、私は(それは黒ですへのアクセス全くないRプログラムによって推定されています今すぐ)。今では、摂取/ ETLプロセスの問題のために陥りがちな0値の数日があります。私は0のデータで日付の値を見積もる必要があります。
我々のアプローチは、以下のとおりです。
- が最新の欠落データに先立って、右 欠落データ
- 推定ラインから欠落している日付の値の後に日から線を引く
2日の間にデータが欠落している唯一の日がある場合、簡単な意味が働きます。データが欠落している連続した日数が2日以上ある場合、平均値は機能しないため、複数のデータポイントの値を見積もる方法を策定しようとしています。
Rで、このアプローチの仕事がしませんか?私はRで合計n00bだから、これが実現可能かどうかは分かりません。
作品以下の回答がありますが、また 'zoo'パッケージと' na.spline'と同じことを実現することができます – CCurtis