2016-05-31 8 views
0

私はTesla K80上でCUDA 7.5とCUDNN v5でTensorflow 0.8を実行しています。すべては問題ありませんが、2つのデバイスが互いにアクセスすることはできません。TensorflowはTeslaをサポートしていますかK80

警告ログは以下のとおりです。ありがとうございました。

I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 0 to device ordinal 2 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 0 to device ordinal 3 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 1 to device ordinal 2 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 1 to device ordinal 3 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 2 to device ordinal 0 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 2 to device ordinal 1 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 3 to device ordinal 0 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 3 to device ordinal 1 
+0

はい、K80のTensorflowを使用できるはずです。表示されている警告は、K80が接続されているシステムの構成の結果であり、K80 GPUまたはTensorflowに固有のものではありません。 NVIDIAは、システムのP2P(ピアアクセス)機能に関するさまざまな種類の情報をすべて提供するサンプルコード(simpleP2P、p2pBandwidthLatencyTest、deviceQueryなど)を提供しています。 –

+0

ありがとうございました。私はsimpleP2Pテストを実行しようとすると、それは2つのGPUは互いにP2Pをアクセスできないことを示しています。私のマシンでそれが有効になっていない理由を知っていますか?以下は私の環境情報です。ありがとうございました。 ubuntu 14.04、Tesla K80、ドライババージョン:352.39。 – Brian

+0

お使いのシステム、つまりマザーボードとシステムBIOSによって異なります。 Hopobcnによって提供された答えを見てください。これらのGPUを2ソケットマザーボードにインストールしておけば、一部のGPUは他のGPUと直接(P2P)通信することができません。しかし、あなたが持っている特定のマザーボードと、GPUが接続されているソケットが分からなければ、正確な答えを出すことは不可能です。 –

答えて

6

Two K80 from different PCIe root complex

は、各K80が同じのPCIeルートコンプレックスを共有していませんでした。 次に、GPU0からGPU1へのピアツーピアアクセスは許可されますが、GPU0からGPU2/GPU3へのアクセスは許可されません。

Tensorflowは、この種のシステムを検出し、GPU間で手動コピーを実行できる必要があります。

3

(それはofficially tested devicesのものではないが)はい、TensorFlowはテスラK80 GPU上で動作すべきです。 Robert Crovella氏がhis commentで指摘したように、これらの警告メッセージは、システムがさまざまなGPUデバイス間のピアツーピアアクセス用に設定されていないと述べているだけですが、TensorFlowを実行することはできます。私はあなたがこのようないくつかのマルチソケット構成持っていることを賭ける

関連する問題