1
私の仕事はしばらくの間実行されていて、マシンの過負荷のために状態が一時停止し、いつか実行されて完了したとしましょう。 このジョブによって取得されたステータスは、実行中 - >強制 - >実行中でした。与えられたジョブのLSFジョブ状態
特定のジョブによって取得されたすべての状態を取得する方法はありますか?
私の仕事はしばらくの間実行されていて、マシンの過負荷のために状態が一時停止し、いつか実行されて完了したとしましょう。 このジョブによって取得されたステータスは、実行中 - >強制 - >実行中でした。与えられたジョブのLSFジョブ状態
特定のジョブによって取得されたすべての状態を取得する方法はありますか?
bjobs -lジョブがシステムからまだクリーニングされていない場合。
bhist -lそれ以外の場合。仕事の所要時間に応じて、-nが必要な場合があります。
ジョブが一時停止され、システムの負荷が設定されたしきい値を一時的に超えたために後で再開されたときのbhist -l出力の例を次に示します。
$ bhist -l 1168
Job <1168>, User <mclosson>, Project <default>, Command <sleep 10000>
Fri Jan 20 15:08:40: Submitted from host <hostA>, to
Queue <normal>, CWD <$HOME>, Specified Hosts <hostA>;
Fri Jan 20 15:08:41: Dispatched 1 Task(s) on Host(s) <hostA>, Allocated 1 Slot(
s) on Host(s) <hostA>, Effective RES_REQ <select[type == any] or
der[r15s:pg] >;
Fri Jan 20 15:08:41: Starting (Pid 30234);
Fri Jan 20 15:08:41: Running with execution home </home/mclosson>, Execution CW
D </home/mclosson>, Execution Pid <30234>;
Fri Jan 20 16:19:22: Suspended: Host load exceeded threshold: 1-minute CPU ru
n queue length (r1m)
Fri Jan 20 16:21:43: Running;
Summary of time in seconds spent in various states by Fri Jan 20 16:22:09
PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
1 0 4267 0 141 0 4409
16:19:22では、r1mがしきい値を超えたためジョブが中断されました。後で16:21:43に仕事が再開されます。
Michaelに感謝しますが、bhist -lは実行中/完了したジョブの現在/最終状態を示します。私は現在の仕事や最終的な状態には興味がありません。 私は仕事によって買収されたすべての状態を知りたいと思っています。 私はしばらくの間実行中のジョブを起動し、システムのしきい値のためにSSUSP状態になり、負荷が正常になった後にRUNNINGに戻ったとします。 今、私はすべての州と州が取得された時間を知ることに興味があります。それを行う方法はありますか? –
'bhist -l'はあなたが望むものです。私は例で私の答えを更新しました。 –
マイケルに説明をしてくれてありがとう! –