2017-03-31 10 views
3

GeForce GT 750Mを搭載したMacBook Proにテンソル1.0.1 GPUバージョンをインストールしました。また、CUDA 8.0.71とcuDNN 5.1もインストールしました。私は非CPUのtensorflowで正常に動作tfのコードを実行しているが、GPUのバージョンにしています、私は(かつてそれはあまりにも動作しますが)、このエラーが出ます:はcudnnハンドルを作成できませんでした:CUDNN_STATUS_INTERNAL_ERROR

name: GeForce GT 750M 
major: 3 minor: 0 memoryClockRate (GHz) 0.9255 
pciBusID 0000:01:00.0 
Total memory: 2.00GiB 
Free memory: 67.48MiB 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:906] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:916] 0: Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:975] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GT 750M, pci bus id: 0000:01:00.0) 
E tensorflow/stream_executor/cuda/cuda_driver.cc:1002] failed to allocate 67.48M (70754304 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY 
Training... 

E tensorflow/stream_executor/cuda/cuda_dnn.cc:397] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR 
E tensorflow/stream_executor/cuda/cuda_dnn.cc:364] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM 
F tensorflow/core/kernels/conv_ops.cc:605] Check failed: stream->parent()->GetConvolveAlgorithms(&algorithms) 
Abort trap: 6 

ここで何が起こっていますか?これはテンソルフローのバグですか?助けてください。私はPythonのコード実行したときにここで

は、GPUのメモリ空間です:

Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 83.477 of 2047.6 MB (i.e. 4.08%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 83.477 of 2047.6 MB (i.e. 4.08%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 83.477 of 2047.6 MB (i.e. 4.08%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 1.1016 of 2047.6 MB (i.e. 0.0538%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 1.1016 of 2047.6 MB (i.e. 0.0538%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 1.1016 of 2047.6 MB (i.e. 0.0538%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 1.1016 of 2047.6 MB (i.e. 0.0538%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 91.477 of 2047.6 MB (i.e. 4.47%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 22.852 of 2047.6 MB (i.e. 1.12%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 22.852 of 2047.6 MB (i.e. 1.12%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 36.121 of 2047.6 MB (i.e. 1.76%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 71.477 of 2047.6 MB (i.e. 3.49%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 67.477 of 2047.6 MB (i.e. 3.3%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 67.477 of 2047.6 MB (i.e. 3.3%) Free 
MacBook-Pro:cuda-smi-master xxxxxx$ ./cuda-smi 
Device 0 [PCIe 0:1:0.0]: GeForce GT 750M (CC 3.0): 67.477 of 2047.6 MB (i.e. 3.3%) Free 
+0

あなたのNVIDIAのGPUのutilの&メモリフィギュアを投稿してください。私はあなたがGPUメモリを使い果たしていると推測しています。 –

+0

どうすればいいですか?ありがとう – Shimano

+0

私は 'nvidia-smi'を使っていますが、macosではこれは存在しません。これを試してください:https://github.com/phvu/cuda-smi –

答えて

2

を私も同じエラーを取得し、私は問題を解決しました。次のように私のシステムプロパティは以下の通りであった。

  • オペレーティングシステム:Ubuntuの14.04
  • GPU:GTX 1050Ti
  • NVIDIAドライバ:375.66
  • Tensorflow:1.3.0
  • Cudnn:6.0.21(cudnn -8.0-Linuxベースのx64-v6.0.deb)
  • クーダ:8.0.61
  • Keras:2.0.8
私はこの問題を解決する方法10

次のとおりです。

  1. 私は
  2. は/ usr/local/CUDA /はは/ usr/local/CUDA/lib64にを含む)に適切な場所にcudnnファイルをコピー私のように環境変数を設定
  3. * export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64" 
    * export CUDA_HOME=/usr/local/cuda 
    
  4. 私はまた、実行時リンカーの共有ライブラリをキャッシュするsudo ldconfig -v commandを実行します。

私はこれらのステップが狂っている人を助けることを願っています。

0

これは奇妙なことに、コンピュータを再起動してモデルを再実行してみてください。モデルがファイルを実行する場合、GPUのメモリ割り当てと使用可能なメモリのテンソルフローの管理が問題となります。 Windows 10では、2つの端末を開いて閉じて1つ問題を解決しました。まだメモリを保持しているオープンスレッド(ゾンビ)が存在する可能性があります。

0

私はそれが私のホームフォルダに.nvフォルダを削除することによって、作業を取得するために管理している:

sudo rm -rf ~/.vn/ 
関連する問題