2013-05-17 30 views
5

のクラスタでにtrain関数が実行されています。doRedisで実行しています。ほとんどの部分については、それは動作しますが、ときどき、私はこのような性質の最後にエラーが発生します:クラスタで実行中にキャレットにエラーが発生しました

error calling combine function: 
<simpleError: obj$state$numResults <= obj$state$numValues is not TRUE> 

Error in names(resamples) <- gsub("^\\.", "", names(resamples)) : 
    attempt to set an attribute on NULL 

私はtraceback()を実行したときに私が手:

5: nominalTrainWorkflow(dat = trainData, info = trainInfo, method = method, 
     ppOpts = preProcess, ctrl = trControl, lev = classLevels, 
     ...) 
4: train.default(x, y, weights = w, ...) 
3: train(x, y, weights = w, ...) 
2: train.formula(couple ~ ., training.balanced, method = "nnet", 
     preProcess = "range", tuneGrid = nnetGrid, MaxNWts = 2200) 
1: caret::train(couple ~ ., training.balanced, method = "nnet", 
     preProcess = "range", tuneGrid = nnetGrid, MaxNWts = 2200) 

これらのエラーは簡単には再現できません(つまり、発生することはありますが、一貫して発生することはありません)。実行の終了時にのみ発生します。クラスタのstdoutには、実行中のタスクと完了したタスクがすべて表示されるので、私はちょっと幻想的です。

これらのエラーが発生しましたか?もしそうなら、その原因を理解し、改善することもできますか?

答えて

2

私はあなたがすでにこの問題を解決したと思いますが、LinuxとWindowsシステムからなる私のクラスタで同じ問題が発生しました。私はubuntu 14.04でサーバーを稼働させていましたが、Linuxカーネルで「透過的な巨大なページ」を有効にすることについてサーバーサービスを開始する際に警告が表示されていました。私はそのメッセージを無視し、機械の大半が労働者に追いつめられた練習を始めました。私は、実行の終了時に同じエラーを受け取りました:

error calling combine function: 
<simpleError: obj$state$numResults <= obj$state$numValues is not TRUE> 

ヘッド傷や役に立たない工夫をたくさんした後、私はここでの指示に従って、その警告に対処することにしました。基本的にhttp://ubuntuforums.org/showthread.php?t=2255151

を、私がインストールさ使用してhugeadm:

sudo apt-get install hugeadm 

は、次に使用して透明ページを無効:

hugeadm --thp-never 

この変更は、コンピュータの再起動時に元に戻されることに注意してください。

トレーニングプロセスを再実行したとき、エラーは発生しませんでした。

希望に役立ちます。

乾杯、 Eric

+0

リンク先が消える可能性があります。リンクが提供するソリューションを反映するように回答を編集してください。そうしないと、リンクのみの回答であるため、回答を削除するリスクがあります。 –

+1

残念ながら、私は上記で提案した修正の後でもまだエラーメッセージが表示されますが、現在ははるかに少ない頻度です。私は、このエラーは、ワーカーが私のLAN/Wifiホームネットワークを最大限に活用しているときに発生するようです。私は、より少ない労働者を使用することで、この問題の発生をさらに減らすことができました。また、私はそれを変更すると失敗した実行ジョブを正常に実行することができるので、すべてのワーカーがジョブを開始したrsessionに対してローカルになります。私はまだこれを試していませんが、労働者がredis-serverで動いてもうまくいくと思っています。 –

関連する問題