slurm

    1

    1答えて

    私は100のジョブのジョブ配列を持っています。私はジョブ配列から2つまでのジョブを同じノードに割り当てることができます。 SLURMを使用してこれを行うにはどうすればよいですか?ありがとう!ジョブは、ノードが均質な構成を持っていること、および、およびクラスタに一人でいることのノードを共有できると仮定すると

    1

    2答えて

    Python 3では、プログラムの実行中にメモリ(RAM)の使用状況を記録する方法はありますか? 背景情報私はslurmを使用してhpcクラスタ上でシミュレーションを実行します。ここでは、ジョブを送信する前にメモリを予約する必要があります。私の仕事はたくさんの記憶を必要としていることは分かっていますが、どれくらいのことがわかりません。だから私は、時間の経過とともにメモリを記録するための簡単な解決策

    0

    2答えて

    ansysに問題があります。私がそれを始めると、いくつかのパーティションについて不平を言う。私たちはslurmを使用しています。ジョブが実行されるslurmパーティションについて不平を言っていますか?しかし、RDMAはより多くのハードドライブパーティションを聞きます。私は少し問題の原因が混乱している。 slurmのファイルシステムまたは異なるキュー(パーティション)へのアクセス?それを修正する方法

    1

    1答えて

    SLURMクラスタ上でパイプラインを実行していて、なんらかの理由で、slurm-XXXXXX.outという名前の小さなファイル(500〜2000バイトのサイズ)がたくさんあります(XXXXXX数)。これらのファイルがSLURMのWebサイトにあるかどうかを調べようとしましたが、そのファイルについては何も言及していません。私は彼らがパイプラインの解析中にシステムが使用するいくつかの種類の進行中のファ

    2

    1答えて

    は、可能な打ち上げは、このようにスクリプトのないバッチコマンドです: qsub -l select=1:ncpus=12:mem=112GB -l walltime=00:30:00 -- /usr/bin/bash -c "mpirun -np 12 sleep 10" ことが可能sbatchとSLURMでそれを行うされていますか?

    0

    1答えて

    私は最初に計算にクラスターを使用しています。その結果、初めてSLURMスクリプトを使用しています。 私は数字のリストに使用しているPythonコードを繰り返しています。私は自分のマシン上でこれをbashスクリプトの単純なwhileループでやっていました。 これはかなり直接SLURMスクリプトに変換されると思いました。ただし、実行時には、リストの最初の番号だけが読み込まれて実行され、その後に実行が停

    1

    1答えて

    slurmを使用して送信された古いジョブのステータスを確認したいとします。私はsacct -jを使用しましたが、仕事が提出された/終了された日付などの正確な情報は私には伝えません。仕事の日時をチェックしたいと思います。私はscontrolを使用しようとしましたが、すでに完了している古いジョブではない現在の実行中/保留中のジョブに対してのみ動作すると思います。すでに完了している古い仕事の仕事の提出日

    2

    1答えて

    blog post by Pierre Lindenbaumには、Makefileの中でsrunが呼び出されてジョブを実行します。私はこのテクニックに頼っていますが、sbatchを一切使用していないので、sbatchのような環境変数を設定する機会がありません。 SLURMが何をすべきか知っているので、どこに次のものを置くことができますか? #SBATCH -J testing #SBATCH -

    0

    2答えて

    私はクラスタ上Rでシミュレーションを実行していますを使用するときにRのコードをデバッグします。各Rファイルには100個のモデルが含まれています。各モデルは異なるデータセットを分析します。クラスタコマンドは、以下に示すslurmファイルに含まれています。 モデルの小さな割合は明らかにヘッセ行列を推定することが十分に収束しないとエラーがこれらのモデルのために生成されます。エラーは、エラーログファイルに