1
私は2ノードとそれぞれ2つのクアッドコアプロセッサを持つDebianクラスタを持っています。私はTorqueとMauiをスケジューラーとして使用します。 16プロセスでMPIジョブを実行しようとすると、スケジューラーはジョブを実行できません。キューに置くか(その時点でジョブが実行されていないにもかかわらず)、実行され、結果の出力ファイルにはわずか4つのプロセッサーで16プロセスのジョブを実行しようとしていました。PBS(トルク)は、4つのプロセッサとしてクアッドコアプロセッサを考慮しません。
次のように私の.../PBS/server_priv /ノードのファイルが見えます:
node1 np=8
node2 np=8
と私はプログラムを実行するために使用しているスクリプトの例は次のとおりです。
#!/bin/sh
#PBS -d /home/bellman/
#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V
ulimit -s 536870912
# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP
mpiexec -np 16 /home/bellman/AAA
私はノードとppnの組み合わせをたくさん試しましたが、2つのエラーのうちの1つが発生します。何が起こっているかについてのアイデア?
は、クラスタが正常に4つの別々のプロセッサとして、各ノードのクアッドコアを処理するように構成されていますか? –
表示される特定のエラーメッセージは何ですか?値をノードに更新してからpbs_serverを再起動しましたか? – dbeer