RのARIMAとxregによる予測

Rの最初の予測実装に問題があります。達成したいのは、変数Yを2つの外生変数X1とX2で予測することです。 3つのデータセットは、それぞれ12行の単一の列として表されます。別のStackpostからRのARIMAとxregによる予測

私は同様のアプローチに続く：私は次のエラーを取得する。このラインで

DataSample <- data.frame(Y=Y[,1],Month=rep(1:12,1), 
        X1=X1[,1],X2=X2[,1]) 

predictor_matrix <- cbind(Month=model.matrix(~as.factor(DataSample$Month)), 
          X1=DataSample$X1, 
          X2=DataSample$X2) 
# Remove intercept 
predictor_matrix <- predictor_matrix[,-1] 

# Rename columns 
colnames(predictor_matrix) <- c("January","February","March","April","May","June","July","August","September","October","November","X1","X2") 

# Variable to be modeled 
var <- ts(DataSample$Y, frequency=12) 

#Find ARIMA 
modArima <- auto.arima(var, xreg = predictor_matrix)

を：

Error in optim(init[mask], armaCSS, method = optim.method, hessian = FALSE, : non-finite value supplied by optim

私は私のpredictor_matrixが正しい形式ではありませんが、私ができることを推測エラーが見つかりません。

助けていただければ幸いです。

出典

2017-02-08 user3488736

「データセットは12行です」と指定しました。予測行列には13の列（11か月のダミー変数？）と2つの他の変数があります。したがって、列間で必然的に線形依存関係があり、最適化手順が失敗します。

プレディクタ変数の数および/またはプレディクタの希薄な集合をサポートするには、（理想的には）多くのデータが必要です。

出典

2017-02-08 15:15:06

これは確かに問題でした。私はより大きなデータセットの例を使用していました。追加されたプレディクタごとに必要なデータセットの数はどれくらいのルールがありますか？ – user3488736

親指のルールは分野によって異なりますが、経済学では変数の妥当性に関する強力な事前適合理論があるため、予測変数の数の少なくとも4倍を目指すことがあります。他のフィールドでは、より多くのデータが必要になることが予想されます。例えば、4倍ではなく8倍である。心理学では、変数の重要性が始まるのが難しいかもしれない。 –

答えて

関連する問題