1
slurmによってジョブがキャンセルされた理由を調べる方法はありますか?リソースの制限が他のすべての理由(手動キャンセルなど)からヒットした場合を区別したいと思います。リソースの制限が当たった場合、私はどちらかを知りたいと思っています。slurmがジョブを停止したアクセス理由
slurmによってジョブがキャンセルされた理由を調べる方法はありますか?リソースの制限が他のすべての理由(手動キャンセルなど)からヒットした場合を区別したいと思います。リソースの制限が当たった場合、私はどちらかを知りたいと思っています。slurmがジョブを停止したアクセス理由
slurmログファイルには、その情報が明示的に含まれています。また、のようなもので、ジョブの出力ファイルに書き込まれます。
JOB <jobid> CANCELLED AT <time> DUE TO TIME LIMIT
または
Job <jobid> exceeded <mem> memory limit, being killed:
または
JOB <jobid> CANCELLED AT <time> DUE TO NODE FAILURE
など