2012-03-15 20 views
1
 -------------------------------------------------------------------------- 
     MPI_ABORT was invoked on rank 2 in communicator MPI_COMM_WORLD 
     with errorcode 1. 

     NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes. 
     You may or may not see output from other processes, depending on 
     exactly when Open MPI kills them. 
      -------------------------------------------------------------------------- 
      -------------------------------------------------------------------------- 
     mpirun has exited due to process rank 2 with PID 19175 on 
     node mosura15 exiting without calling "finalize". This may 
      have caused other processes in the application to be 
      terminated by signals sent by mpirun (as reported here). 

私はシミュレーションを実行しています。 MPIコマンドで、上記のエラーが見つかりました。これの背後にある理由は何か。どうすれば解決できますか?mpirunコマンドのエラー

答えて

1

プログラムの3番目のインスタンス(ID 2)がクラッシュしたように見えて、MPI_Finalize()が終了しないため、mpirunはプログラムの他のすべてのコピーも閉じました。その特定のノードにクラッシュさせる何かがあるか、毎回別のノードですか?

+0

はい、毎回異なります。 – Kabir

3

メッセージはかなり明確です。ランク2はMPI_Abort()と呼ばれ、プログラム全体が停止します。あなたのコードを見て、プログラムがMPI_Abort()を呼び出すエラー条件を調べることができるはずです。

関連する問題