2016-10-21 6 views
0

私はMPIを使用してプログラムを作成し、2つの異なるクラスターにアクセスします。私はシステム管理が良くないので、そこで使われているソフトウェア、OS、コンパイラについては何も教えてくれません。MPIはRecvデッドロックを送信します

#include "mpi.h" 
#include <iostream> 

int main(int argc, char **argv) { 

    int rank, numprocs; 
    MPI_Status status; 

    MPI_Init(&argc, &argv); 
    MPI_Comm_rank(MPI_COMM_WORLD, &rank); 
    MPI_Comm_size(MPI_COMM_WORLD, &numprocs); 

    int x = rank; 

    if (rank == 0) { 
     for (int i=0; i<numprocs; ++i) 
      MPI_Send(&x, 1, MPI_INT, i, 100500, MPI_COMM_WORLD); 
    } 
    MPI_Recv(&x, 1, MPI_INT, 0, 100500, MPI_COMM_WORLD, &status); 

    MPI_Finalize(); 
    return 0; 
} 

エラーメッセージが関連している:

Fatal error in MPI_Send: Other MPI error, error stack: 
MPI_Send(184): MPI_Send(buf=0x7fffffffceb0, count=1, MPI_INT, dest=0, tag=100500, MPI_COMM_WORLD) failed 
MPID_Send(54): DEADLOCK: attempting to send a message to the local process without a prior matching receive 

なぜようである。しかし、一台のマシン上で、私はそのようなコードを使用して、デッドロックがありますか?私は理解できません、なぜそれは1つのマシンで起こりますが、別のマシンでは起こりませんか?

答えて

1

MPI_Sendはブロック動作です。一致する受信が送信されるまで、完了しないことがあります。あなたの場合、rankは、一致する受信を投稿する前に、自分自身にメッセージを送信しようとしています。このようなことをしなければならない場合は、受信後にMPI_SendをMPI_Isend (+ MPI_Wait ... `に置き換えます。しかし、あなたは彼に自分自身にメッセージを送るようにしないでください。

あなたのケースで使用する適切なものはMPI_Bcastです。

+0

ありがとう、私の場合、私はMPI_Bcastを使用できません(コード関連は私のreallifeプログラムの一例です)。 – user2923317

+0

MPIには多くの異なる一括操作が用意されています。適用可能な場合はいつでもそれらを使用することが一般に好ましい。アプリケーションの通信パターンに近い例を示すことをお勧めします。 – Zulan

1

ランク0はすでにxの正しい値を持っているため、メッセージで送信する必要はありません。これは、ループ内で使用すると、0をランク付けし、代わりに、ランク1から開始するために送信スキップする必要があることを意味します

if (rank == 0) { 
    for (int i=1; i<numprocs; ++i) 
     MPI_Send(&x, 1, MPI_INT, i, 100500, MPI_COMM_WORLD); 
} 
MPI_Recv(&x, 1, MPI_INT, 0, 100500, MPI_COMM_WORLD, &status); 

今すぐ0は自分自身に話をしようとはしませんランクが、受信は条件外であることから、それ自身からメッセージを受信しようとします。別のより複雑な解決策は、送信操作の前に受信を投稿する非ブロック操作を使用することです

if (rank == 0) { 
    for (int i=1; i<numprocs; ++i) 
     MPI_Send(&x, 1, MPI_INT, i, 100500, MPI_COMM_WORLD); 
} 
else 
    MPI_Recv(&x, 1, MPI_INT, 0, 100500, MPI_COMM_WORLD, &status); 

MPI_Request req; 

MPI_Irecv(&x, 1, MPI_INT, 0, 100500, MPI_COMM_WORLD, &req); 
if (rank == 0) { 
    int xx = x; 
    for (int i=0; i<numprocs; ++i) 
     MPI_Send(&xx, 1, MPI_INT, i, 100500, MPI_COMM_WORLD); 
} 
MPI_Wait(&req, &status); 

は今0意志をランク付けするソリューションは、単に代替枝を受け取るようにすることですMPI_Sendにはブロックされていません。既に一致する受信が以前に投稿されているためです。他のすべてのランクにおいてMPI_Irecvのすぐ後にはMPI_Waitが続き、これはブロッキング受信(MPI_Recv)に相当します。 xの値は、条件付きの別の変数にコピーされることに注意してください。これは、MPI標準によって、同じメモリ位置との送受信が同時に行われるためです。

関連する問題