lsf

    1

    1答えて

    私は標準的な統計シミュレーションを実行しています。 100個の配列ノードの中で10000回の反復(それぞれが異なるランダムなシードを持つ)。 これまで何度もやってきたことがありましたが、今度は100個のノードすべてがまったく同じ結果を出すようになりました。同じ種にすべてを設定できるLSFには微妙なものがありますか? 私はRジョブを実行していますが、Rでシードを設定していません。アレイ内のジョブイン

    0

    2答えて

    LSFジョブ配列を実行して、メークファイルにターゲットを作成しています。 しかし、配列が送信されると、makeはターゲットのコマンドが実行されたとみなし、ターゲットが存在しないためエラーをスローします。 他の依存ターゲットに移動する前に、LSFジョブアレイの完了まで待つようにするにはどうすればよいですか? 例: all: final.txt first_%.txt: bsub -J"

    1

    1答えて

    私はGPFSクラスタの一部であるいくつかのRHEL7マシンを持っています。そして、メモリが使い果たされると、GPFSデーモンとドライバがクラッシュして、管理するファイルシステムを停止させます。 user.slice、kubepods.slice、およびlsf(LSFジョブキュー用)の3つのcgroupメモリ階層を制限します。私はこれらの3つのグループの合計メモリ消費量に100Gの制限を設けたいと思

    0

    2答えて

    LSFジョブスケジューラで動作するようにテンソルフローを設定するには? LSFの経験はほとんどありません。 tf.train.ClusterSpecには、ワーカーおよびパラメータサーバのIPアドレスが必要です。 LSF環境からそれらを得ることは可能ですか?一緒に働くという成功事例はありますか? EDIT: はSLURMクラスターRunning TensorFlow on a Slurm Clust

    2

    1答えて

    私はIBM Platform LSF(Linux上)を使用するマルチユーザークラスタのユーザーです。私は同じ仕事に関して自分の仕事の優先順位を変えたいと思っています(待ち行列の仕事の絶対優先順位ではありません)。 例:キューで500ジョブを開始しました。このジョブは完了するまでに4日間かかっていますが、後で、私がすでに提出した500ジョブの前に実行したい別のジョブをサブミットしたいと思います。私が

    1

    1答えて

    初期実行スロットにrusage [mem =]の値が1つあり、その他のrusage値が異なるLSFを使用してジョブをサブミットすることは可能ですか?ジョブはマスタースレーブです。マスターはたくさんの記憶と奴隷を必要とします。 [1 * rusage [mem = 6000] + 2 * rusage [mem = 1000]]を選択するなど、さまざまな選択仕様を試しましたが、「無効なリソース指定」

    1

    1答えて

    私の仕事はしばらくの間実行されていて、マシンの過負荷のために状態が一時停止し、いつか実行されて完了したとしましょう。 このジョブによって取得されたステータスは、実行中 - >強制 - >実行中でした。 特定のジョブによって取得されたすべての状態を取得する方法はありますか?

    1

    1答えて

    適切な解決策が見つかるまでlockfile problemを軽減するために、LSFにホストごとに自分のジョブを1つ置くように指示したいと思います。 -x flag私の仕事はホストの排他的使用を保証しますが、これは必要ありません。私は他の人と分かち合っています。私は自分自身と共有したくない。 ホスト全体を排他的に使用することを要求せずに、自分のジョブのせいぜい1つが特定のホストで実行されていることを

    1

    1答えて

    に関するエラーの原因となっています。 > bsub -I p4 client -o Job <7966594> is submitted to default queue <normal>. <<Waiting for dispatch ...>> <<Starting on XXX>> Perforce password (P4PASSWD) invalid or unset. どの

    0

    1答えて

    実行には数時間かかるかもしれない大規模ジョブアレイを送信していますが(数分以内にエラーが発生する場合もあります)、完了したらメールを受け取る。 bsubのフラグを-ooフラグに設定しないと、配列内の各ジョブが完了すると私に電子メールが送信されますが、配列全体が何時になるかを数える電子メールをカウントする必要はありませんスルー。 bsubには、すべてのジョブが終了したときに発生するアクションを指定で