2017-05-10 4 views
0

Peer access not supported between device ordinalsがある場合、何らかのマルチGPU設定でトレーニングを実行することはできますか(GPUは「接続されていない」と認識しています)私はこれがCaffeバックエンドを使ってDIGITSでの「バッチ蓄積」の仕組みであると理解しているので、CPUでマージしてください。Tensorflow:ピアのアクセスはデバイスのサークル間でサポートされていません

生出力:

2017-05-10 15:27:54.360688: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 0 and 1 
2017-05-10 15:27:54.360949: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 0 and 2 
2017-05-10 15:27:54.361504: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 0 and 3 
2017-05-10 15:27:54.361738: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 1 and 0 
2017-05-10 15:27:54.361892: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 1 and 2 
2017-05-10 15:27:54.362065: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 1 and 3 
2017-05-10 15:27:54.362263: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 2 and 0 
2017-05-10 15:27:54.362485: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 2 and 1 
2017-05-10 15:27:54.362693: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 2 and 3 
2017-05-10 15:27:54.362885: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 3 and 0 
2017-05-10 15:27:54.362927: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 3 and 1 
2017-05-10 15:27:54.362967: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 3 and 2 
2017-05-10 15:27:54.364638: I tensorflow/core/common_runtime/gpu/gpu_device.cc:908] DMA: 0 1 2 3 
2017-05-10 15:27:54.364668: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 0: Y N N N 
2017-05-10 15:27:54.364687: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 1: N Y N N 
2017-05-10 15:27:54.364702: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 2: N N Y N 
2017-05-10 15:27:54.364717: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 3: N N N Y 

答えて

1

このメッセージは、(それが "INFO" メッセージ、エラーではありません)は良性です。 Tensorflowのすべてが機能しますが、ピアツーピアアクセスをサポートしていた別のハードウェアよりも遅くなる可能性があります。

メッセージは、GPU間でピアツーピアアクセスが不可能であることをNVIDIAドライバが報告していることを意味します。詳細は、https://developer.nvidia.com/gpudirectを参照してください。

あなたはバストポロジーを表示するには、コマンド

nvidia-smi topo -m 

を使用することができます。

+0

Windowsの場合、nvidia-smi topo -m 入力引数の組み合わせが無効です。助けのために 'nvidia-smi -h'を実行してください。 – empty

+0

@emptyと 'nvidia-smi -h'とは何ですか? Windows上のいくつかのプログラムは、ダッシュではなくスラッシュで引数をとります。それはあまりにもそのような場合ですか? –

+0

@CiprianTomoiaga nvidia-smi -hには 「NVIDIAシステム管理インターフェイス-v385.54」とオプションおよびフラグのリストがあり、いずれも「topo」ではありません。オプションの一覧は次のとおりです:dmon、daemon、replay、pmon、nvlink、clocks、encodersessions – empty

関連する問題