ansysに問題があります。私がそれを始めると、いくつかのパーティションについて不平を言う。私たちはslurmを使用しています。ジョブが実行されるslurmパーティションについて不平を言っていますか?しかし、RDMAはより多くのハードドライブパーティションを聞きます。私は少し問題の原因が混乱している。 slurmのファイルシステムまたは異なるキュー(パーティション)へのアクセス?それを修正する方法。以前にこのバグに遭遇したことはありますか?Ansys MPI_Init_thread:複数のpkeyが見つかりました/パーティションキーテーブル/ MPI_IB_PKEY
これは、NFS/opt(ansysインストール)とBeeGFS/work dir(モデルなど)を持つslurmクラスタ上で実行されています。
cfx5remote: Rank 0:35: MPI_Init_thread: multiple pkey found in partition key table, please choose one via MPI_IB_PKEY
cfx5remote: Rank 0:35: MPI_Init_thread: pkey table:
cfx5remote: Rank 0:35: MPI_Init_thread: 0x8001
cfx5remote: Rank 0:35: MPI_Init_thread: 0x7fff
cfx5remote: Rank 0:25: MPI_Init_thread: multiple pkey found in partition key table, please choose one via MPI_IB_PKEY
cfx5remote: Rank 0:25: MPI_Init_thread: pkey table:
cfx5remote: Rank 0:35: MPI_Init_thread: 0xffff
cfx5remote: Rank 0:25: MPI_Init_thread: 0x8001
cfx5remote: Rank 0:25: MPI_Init_thread: 0x7fff
cfx5remote: Rank 0:25: MPI_Init_thread: 0xffff
cfx5remote: Rank 0:25: MPI_Init_thread: ibv_get_pkey() failed
cfx5remote: Rank 0:21: MPI_Init_thread: multiple pkey found in partition key table, please choose one via MPI_IB_PKEY
cfx5remote: Rank 0:25: MPI_Init_thread: Can't initialize RDMA device
我々は異なるOpenMPIのバージョンを持つノード間のイーサネットとomnipathリンクを持っています。私の推測では、AnsysはイーサネットリンクかOmnipathリンクかを判断できません。 ansysにOmnipathを使用するように指示する方法はありますか? – Networkguy