0
ソースコード用に4ノードクラスタにSGEを構築しました。 Centos7のオペレーティングシステム。そして、私はクラスタで単純なタスクを提出すると、1つのノードで1つのタスクしか実行されていないことがわかりました。どうしたの?ここに私のタスクコードは次のとおりです。sgeは1つのノードで1つのタスクしか実行できません
sleep 60
echo "done"
、これはタスクを提出する私のCMDです:qstatの-fを実行すると
DIR=`pwd`
option=""
for((i=0;i<5;i++));do
qsub -q multislots $option -V -cwd -o stdout -e stderr -S /bin/bash $DIR/test.sh
sleep 1
done
、それは示しています。ジョブに関するエラーメッセージが与えられenter image description here
3つのノードで動作する3つのジョブが表示されます(誤っていない場合、node332のジョブ505、node335のジョブ506、および504のノード336のジョブ)。単一のノードで実行されている単一のタスク? –
私はnode335に16のスロットがあり、job506には1つのみが使用されていて、キュー内で2つのジョブが待機していることを意味します。なぜ左の2つのジョブは実行されませんでしたか? – MUYOUHUIYAO
ファイルdefault/spool/qmaster/messagesを見ると、次のようなエラーが表示されます。「ジョブ519.1がジョブの前に想定されていたためにnode332が失敗しました:未使用のadd_grp_idが見つかりません」 – MUYOUHUIYAO