2017-07-05 5 views
0

だから私は2つのデータセットを持っています。不足している値を分布で埋める

最初の1つは、1時間ごとの値があります。例:私はので、私は最初のデータセットの同じ分布することにより、第2のデータセットの合計を配布したい

Date     Value 
05/07/2017   40 

毎日の合計を持っている第二のデータセットで

Date     Value 
05/07/2017 01:00  5 
05/07/2017 02:00  10 
05/07/2017 03:00  5 

。このようなもの:

Date     Value 
05/07/2017 01:00  10 
05/07/2017 02:00  20 
05/07/2017 03:00  10 

どうすればいいですか?私はRを使い、最初のデータセットの時系列を作成しました。

+0

あなたの問題を解決した場合は、回答を受け入れてください。 – luchonacho

答えて

1

欠損データの代用を専門とするRのmiceパッケージをチェックしたい場合があります。あなたのケースでは、おそらく同様の(時間)アトリビュートごとのサンプルを欺いて欠損値を代入するknnメソッドがそのトリックを行うかもしれません。

2回目の見方では、異なる時間に渡って値をブートストラップし、ランダム(時間)の組み合わせを見つけなければならない欠けている値を埋めるためにもっと洗練された手順が可能かもしれません(あなたが持っている合計に合計するこれらの時間の特定の時間プールまたは分布の各時間のランダムサンプル)。

+0

私が探している洞察力はありますか? –

+0

申し訳ありませんが、洞察力の意味は?どちらの方法論があなたにとって魅力的なように思えるか? –

+0

もし私が正しいと理解すれば、最初のデータは毎日繰り返されるパターンを持っているので、最初のものと思います。 –

関連する問題