最初はランダムな問題だと思っていましたが、スクリプトを再実行すると再び発生します。R h2oサーバCURLエラー、繰り返しの種類
Error in .h2o.doSafeREST(h2oRestApiVersion = h2oRestApiVersion, urlSuffix = urlSuffix, :
Unexpected CURL error: Recv failure: Connection reset by peer
私はグラデーション後押しマシン・モデルで(約40000×30)中規模のデータセット上のグリッドサーチをやっています。グリッド内の最大のツリーは1000です。これは通常、2時間実行した後に発生します。私はmax_mem_size
を30Gbに設定しました。
for (k in 1:nrow(par.grid)) {
hg = h2o.gbm(training_frame = Xtr.hf,
validation_frame = Xt.hf,
distribution="huber",
huber_alpha = HuberAlpha,
x=2:ncol(Xtr.hf),
y=1,
ntrees = par.grid[k,"ntree"],
max_depth = depth,
learn_rate = par.grid[k,"shrink"],
min_rows = par.grid[k,"min_leaf"],
sample_rate = samp_rate,
col_sample_rate = c_samp_rate,
nfolds = 5,
model_id = p(iname, "_gbm_CV")
)
cv_result[k,1] = h2o.mse(hg, train=TRUE)
cv_result[k,2] = h2o.mse(hg, valid=TRUE)
}
H2Oの追加メモリを試しましたか? H2Oクラスターのメモリーが不足している可能性があります。あなたが訓練しようとしているモデルがいくつあるのか分かりません(技術的には、 'nfolds = 5'を持っているため、'(5 + 1)* nrow(par.grid) 'というモデルがあります)あなたのRAMを食べなさい... –
@ErinLeDell私はそれがRAMであることを確認することができます。これは実際には別のループの内部ループなので、メモリの需要はさらに大きくなります。あなたはなぜそれがすべての(5 + 1)* Nモデルを保持しているのですか?実行が終了したら、以前のモデルを上書きする必要があります。 – horaceT