私は時系列でtbatsモデルを訓練するPositiveTBATSという関数を持つ以下のコードを持っています。この関数は、0を0.001に置き換えてログ変換の-inf値を使用しないようにして、時系列にログ変換を適用します。ログの変換は、予測値が負の値を返さないようにすることです。次に、関数を複数の時系列に適用することを並列化する別のコードを用意しました。私が抱えている問題は、予測の上限が常に実際のデータよりも少し低いように見えるということです。私は、より高い予測値を得るのに役立つ可能性のある、tbatsモデルで調整できるパラメータがあるかどうか疑問に思っていました。予測の低い値は実際のデータにかなり近いです。は一貫して低いと予測されています
##Parallelizing TBATS Model Training
## Making tbats forecast positive
PositiveTBATS<-function(y){
z<-replace(y,y==0,0.001)
x <- log(z)
fit <- tbats(x, use.box.cox=FALSE)
fit$lambda <- 0
fit$control$use.box.cox <- TRUE
fc <- forecast(fit,h=20)
fc$x <- exp(x)
fc
}
# Calculate the number of cores
no_cores <- floor(detectCores()/4)
# Initiate cluster
cl <- makeCluster(no_cores)
clusterEvalQ(cl, library(forecast))
tbatsList<-list(mts2DataTs1, mts2DataTs2)
tbatsModels<-parLapply(cl, tbatsList,
PositiveTBATS)
stopCluster(cl)
Data:
dput(mts2DataTs1[1:100])
c(50, 48, 47, 41, 33, 24, 23, 24, 25, 31, 36, 48, 56, 68, 79,
81, 87, 90, 81, 87, 90, 86, 79, 72, 60, 50, 39, 29, 30, 30, 31,
29, 31, 35, 44, 54, 71, 70, 83, 87, 93, 98, 104, 105, 101, 92,
94, 83, 76, 66, 64, 55, 48, 42, 38, 33, 34, 36, 47, 51, 58, 65,
71, 81, 89, 86, 89, 89, 86, 75, 73, 74, 57, 49, 41, 32, 33, 25,
24, 26, 28, 33, 42, 56, 61, 71, 74, 77, 84, 91, 90, 91, 91, 89,
93, 90, 79, 66, 66, 48)
dput(mts2DataTs2[1:100])
c(2, 2, 1, 0, 0, 1, 2, 0, 1, 4, 8, 7, 7, 6, 5, 5, 4, 3, 1, 5,
9, 5, 3, 2, 0, 0, 1, 0, 1, 0, 0, 2, 1, 5, 6, 5, 3, 2, 5, 4, 6,
5, 3, 4, 2, 5, 2, 1, 0, 4, 1, 2, 2, 2, 1, 1, 2, 1, 2, 7, 7, 3,
7, 3, 3, 2, 0, 4, 1, 3, 4, 1, 3, 0, 1, 3, 1, 0, 1, 3, 2, 4, 4,
2, 4, 5, 4, 3, 8, 3, 3, 5, 4, 3, 1, 1, 1, 2, 1, 1)
ありがとうございます。私はそれを試みたが、それは予測を改善しなかった。私はそれ以前に言及していませんでしたが、mts2DataTs1 <-msts(na.approx(Datats1)、seasonal.periods = c(24,7 * 24,365 * 24))、それではseasonals.periodsをtbats部分に含める必要があります関数の? – user3476463
クラスを季節のあるmstsに指定した場合は、問題ありません。毎時のデータを扱っているようです。さまざまな頻度でデータを調査し、頻度の異なる予測の調整を行うことを検討することもできます(例:泥棒パッケージを調べる)。 – Julius