2017-03-29 13 views
0

私はかなり新しく、ARIMA時系列予測を実行しようとしています。私が15分間に電気負荷で調べているデータ。次のように私のデータが見えます:時系列グラフに流体線が表示されない

day month year PTE periode_van periode_tm gemeten_uitwisseling 
1 1 01 2010 1  0 secs 900 secs     2636 
2 1 01 2010 2 900 secs 1800 secs     2621 
3 1 01 2010 3 1800 secs 2700 secs     2617 
4 1 01 2010 4 2700 secs 3600 secs     2600 
5 1 01 2010 5 3600 secs 4500 secs     2582 
geplande_import geplande_export    date weekend 
1    719   -284 2010-01-01 00:00:00  0 
2    719   -284 2010-01-01 00:15:00  0 
3    719   -284 2010-01-01 00:30:00  0 
4    719   -284 2010-01-01 00:45:00  0 
5    650   -253 2010-01-01 01:00:00  0 
weekday Month gu_ma 
1  5 01 NA 
2  5 01 NA 
3  5 01 NA 
4  5 01 NA 
5  5 01 NA 

私は次のコード

library("zoo") 
ZOO <- zoo(NLData$gemeten_uitwisseling, 
order.by=as.POSIXct(NLData$date, format="%Y-%m-%d %H:%M:%S")) 

ZOO <- na.approx(ZOO) 
tsNLData <- ts(ZOO) 

plot(tsNLData) 

を使用していた時系列を作成するために、私はデータをプロットするとき、私はまた、しかし、次の

NLDatats <- ts(NLData$gemeten_uitwisseling, frequency = 96) 

を試してみました私は次のようになる。

Time Series plot

どのように私はこの問題を解決することができますか?

+0

問題の詳細を説明できますか?あなたのデータには季節と日周期があるようです。グラフは正しいと思われ、おそらくあなたがプロットしているものを考慮して予想されます。 – Roland

+0

@Roland私はARIMAの予測をしようとしていますが、常に高いp値が得られ、ACFとPACFは高い値を生成します。だから私は、グラフがこのように見えない他の例のように、時系列に何か間違っていたかどうか疑問に思っていました。私は季節性を取り除いたが、日周のサイクルを取り除かずに問題を解決できるかもしれない。 – NikkiB

+0

あなたの実際の問題は、あなたが見せてくれないものです... – Roland

答えて

0

グラフに問題はないようですが、データは15分間隔で表示され、4年分のデータをプロットしています。当然ながら、それは暗い陰影を帯びた領域のように見えます。なぜなら、一連のデータ点を1つのプロットに表示する方法がないからです。

このような多くのデータを処理するのに苦労している場合は、結果から季節性と自己相関が取り除かれますが、プロットする前にデータフレームからサンプリングを検討することができます。これは、時間の経過とともに結果の平均値を知りたいが、データの季節的および自己相関的な構造を見るのに役立たない場合に役立ちます。

dplyrおよびggplot2を使用する以下のコードを参照して、これらの問題を示すシミュレーション時系列をプロットします。シミュレートされたデータから始めて、自分のデータを使って作業することが常にベストです。

require(ggplot2) 
require(dplyr) 

sim_data <- arima.sim(model=list(ar=.88,order=c(1,0,0)),n=10000,sd=.3) 

#Too many points 
data_frame(y=as.numeric(sim_data),x=1:10000) %>% ggplot(aes(y=y,x=x)) + geom_line() + 
    theme_minimal() + xlab('Time') + ylab('Y_t') 


#Sample from data (random sample) 
#However, this will remove autocorrelation/seasonality 
data_frame(y=as.numeric(sim_data),x=1:10000) %>% sample_n(500) %>% 
    ggplot(aes(y=y,x=x)) + geom_line() + theme_minimal() + xlab('Time') + ylab('Y_t') 


# Plot a subset, which preserves autocorrelation and seasonality 
data_frame(y=as.numeric(sim_data),x=1:10000) %>% slice(1:300) %>% 
    ggplot(aes(y=y,x=x)) + geom_line() + theme_minimal() + xlab('Time') + ylab('Y_t') 
関連する問題