this questionで説明したように、GTX 1080カードとnvidia-dockerで「最初に実行されるスローダウン」問題が発生しました。TensorFlowで利用可能なすべてのカーネルのCUDA JITキャッシュをプログラムで構築する方法は?
私はits official pip packageのTensorFlowビルドと、nvidia-dockerのUbuntu 16.04ベースイメージに基づくカスタムドッカーイメージを使用しています。
Dockerfileに登録されたすべてのCUDAカーネルをプログラムでロード(およびJITキャッシュを構築)するにはどうすればよいですか?
これはかなり面白いです。私たちの[github](https://www.github.com/tensorflow/tensorflow/issues)ページに投稿できますか?さらなる指示やコードのいずれかでそれを緩和するためにできることがあれば、それは良いでしょう。 – drpng