2016-08-01 10 views
1

ソースから現在のマスターバージョンをコンパイルしています。私はCUDA 7.5とCUDNN 4.0を使用してコンパイルする場合、私は次のコンパイルエラーが表示されます。私はCUDNN 5.1でコンパイルした場合Tensorflow:RC 0.10 3X 0.9より遅い

ERROR: /home/rob/tensorflow/tensorflow/contrib/rnn/BUILD:45:1: undeclared inclusion(s) in rule '//tensorflow/contrib/rnn:python/ops/_lstm_ops_gpu': 
this rule is missing dependency declarations for the following files included by 'tensorflow/contrib/rnn/kernels/lstm_ops_gpu.cu.cc': 
'/usr/local/cuda-7.5/include/cuda_runtime.h' 
'/usr/local/cuda-7.5/include/host_config.h' 
'/usr/local/cuda-7.5/include/builtin_types.h' 
[etc...] 

、すべてがコンパイルされ、実行されますが、実行時間がトレーニングスクリプトの長いおよそ3倍である私は、現在実行していますこれは、pip経由でインストールされた0.9.0リリースを使用した場合と同じです。

私も0.10.rc0のピップバージョン(GPU)を試してみましたし、同じ3Xは、私はUbuntuの14.04、PY 3.4テスラK40cのGPUを使用していますバージョン0.9.0

対遅く見ました。 Bazelはバージョン0.3.1

ver 0.10.0rc0の3倍速減速の原因は何ですか?以前のパフォーマンスを回復する方法はありますか?

二次的に、CUDNN 4を使用する際にビルドエラーをどのように排除できますか?

+0

これは、0.10リリース候補にバグがあるようです。あなたはあなたのトレーニングスクリプトに関するいくつかの情報とともに[GitHub issue](https://github.com/tensorflow/tensorflow/issues)を開きますか?ありがとう! – mrry

+0

@mrry - done、[issue 360​​3](https://github.com/tensorflow/tensorflow/issues/3603) – RobR

答えて

1

相対的な遅さ0.10.0rc0は、確認されているバグです。詳細情報とステータスはthis threadにあります。