2012-02-27 12 views
0

コンドルプールは4つの専用マシンで構成されていますが、センターマネージャ、サブミット、実行ノードとして設定され、残りの3つは設定されていますCentOS 5.4をすべてのマシンのOSとして使用しているノードを実行しています。私の問題は、セントラルマネージャーからジョブを送信したときにセントラルマネージャーだけで動作するため、JDLファイルで、セントラルマネージャー以外のマシンでジョブを実行するように指定した場合、ジョブは保持されて実行されません。 condor_statusと入力すると、すべてのノードが表示されます。実行中のノードのデーモンリストに、デーモンMASTER、STARTDを保持します。誰もこの問題に遭遇しますか?セントラルマネージャー以外のコンドルで実行ノードにジョブをサブミットできませんでした

答えて

0

あなたの質問に答えるには十分な情報はありませんが、まずはcondor_q -analyze <jobid>を実行して何が表示されるかを確認してください。 Condorのマニュアルを参照してくださいSection 2.6.5: Why is the job not running?

考えられる原因の1つは、入力ファイルと出力ファイルを転送するようにCondorに指示しておらず、ノードに「ファイルシステムドメイン」が異なるため、Condorは共有するホストを見つけることができませんあなたの提出ホストと共通のファイルシステム。

関連する問題