ソースから現在のマスターバージョンをコンパイルしています。私はCUDA 7.5とCUDNN 4.0を使用してコンパイルする場合、私は次のコンパイルエラーが表示されます。私はCUDNN 5.1でコンパイルした場合Tensorflow:RC 0.10 3X 0.9より遅い
ERROR: /home/rob/tensorflow/tensorflow/contrib/rnn/BUILD:45:1: undeclared inclusion(s) in rule '//tensorflow/contrib/rnn:python/ops/_lstm_ops_gpu':
this rule is missing dependency declarations for the following files included by 'tensorflow/contrib/rnn/kernels/lstm_ops_gpu.cu.cc':
'/usr/local/cuda-7.5/include/cuda_runtime.h'
'/usr/local/cuda-7.5/include/host_config.h'
'/usr/local/cuda-7.5/include/builtin_types.h'
[etc...]
、すべてがコンパイルされ、実行されますが、実行時間がトレーニングスクリプトの長いおよそ3倍である私は、現在実行していますこれは、pip経由でインストールされた0.9.0リリースを使用した場合と同じです。
私も0.10.rc0のピップバージョン(GPU)を試してみましたし、同じ3Xは、私はUbuntuの14.04、PY 3.4テスラK40cのGPUを使用していますバージョン0.9.0
対遅く見ました。 Bazelはバージョン0.3.1
ver 0.10.0rc0の3倍速減速の原因は何ですか?以前のパフォーマンスを回復する方法はありますか?
二次的に、CUDNN 4を使用する際にビルドエラーをどのように排除できますか?
これは、0.10リリース候補にバグがあるようです。あなたはあなたのトレーニングスクリプトに関するいくつかの情報とともに[GitHub issue](https://github.com/tensorflow/tensorflow/issues)を開きますか?ありがとう! – mrry
@mrry - done、[issue 3603](https://github.com/tensorflow/tensorflow/issues/3603) – RobR