2017-07-28 11 views
1

slurmによってジョブがキャンセルされた理由を調べる方法はありますか?リソースの制限が他のすべての理由(手動キャンセルなど)からヒットした場合を区別したいと思います。リソースの制限が当たった場合、私はどちらかを知りたいと思っています。slurmがジョブを停止したアクセス理由

答えて

1

slurmログファイルには、その情報が明示的に含まれています。また、のようなもので、ジョブの出力ファイルに書き込まれます。

JOB <jobid> CANCELLED AT <time> DUE TO TIME LIMIT 

または

Job <jobid> exceeded <mem> memory limit, being killed: 

または

JOB <jobid> CANCELLED AT <time> DUE TO NODE FAILURE 

など

関連する問題