私はTesla K80上でCUDA 7.5とCUDNN v5でTensorflow 0.8を実行しています。すべては問題ありませんが、2つのデバイスが互いにアクセスすることはできません。TensorflowはTeslaをサポートしていますかK80
警告ログは以下のとおりです。ありがとうございました。
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 0 to device ordinal 2
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 0 to device ordinal 3
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 1 to device ordinal 2
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 1 to device ordinal 3
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 2 to device ordinal 0
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 2 to device ordinal 1
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 3 to device ordinal 0
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 3 to device ordinal 1
はい、K80のTensorflowを使用できるはずです。表示されている警告は、K80が接続されているシステムの構成の結果であり、K80 GPUまたはTensorflowに固有のものではありません。 NVIDIAは、システムのP2P(ピアアクセス)機能に関するさまざまな種類の情報をすべて提供するサンプルコード(simpleP2P、p2pBandwidthLatencyTest、deviceQueryなど)を提供しています。 –
ありがとうございました。私はsimpleP2Pテストを実行しようとすると、それは2つのGPUは互いにP2Pをアクセスできないことを示しています。私のマシンでそれが有効になっていない理由を知っていますか?以下は私の環境情報です。ありがとうございました。 ubuntu 14.04、Tesla K80、ドライババージョン:352.39。 – Brian
お使いのシステム、つまりマザーボードとシステムBIOSによって異なります。 Hopobcnによって提供された答えを見てください。これらのGPUを2ソケットマザーボードにインストールしておけば、一部のGPUは他のGPUと直接(P2P)通信することができません。しかし、あなたが持っている特定のマザーボードと、GPUが接続されているソケットが分からなければ、正確な答えを出すことは不可能です。 –