2016-05-27 34 views
3

たとえば30回のジョブを実行する必要がありますが、各ジョブが特定のノードリスト(同じパフォーマンスを持ち、タイミングをかなり比較するノード)のノードで実行されていることを確認してください。 どうやったらいいですか?SLURM:特定のノードで30個のジョブを実行するには?

  • srun --nodelist=machineN[0-3] <some_cmd>:私が試した何

    同時に<some_cmd>すべて上のノードを実行します(私は必要なもの:リストから使用可能なノードの上<some_cmd>を実行するために)

  • srun -p partitionは動作するようですが、必ずしもそうでないmachineN [0-3]を含むパーティションが必要です。

アイデア?

答えて

4

あなたは反対方向を行くとsbatch--excludeオプションを使用することができます

srun --exclude=machineN[4-XX] <some_cmd> 

を次にSLURMだけ除外リストに記載されていないノードを検討します。リストが長くて複雑な場合は、ファイルに保存することができます。別のオプションはSLURM構成は「

sinfo --format "%20N %20f" 

有する」機能「」を含むかどうかを「機能」列には、各ノードが持つ機能のカンマ区切りのリストを示しているかどうかをチェックすることである

(かもしれませんCPUファミリ、ネットワーク接続タイプなど)を使用して、特定の機能を持つノードのサブセットを選択することができます。

srun --constraint=<some_feature> <some_cmd> 
関連する問題