2017-04-12 9 views
4

This exampleは、テンソルフロープログラムのプロファイル方法を示しています。私はこのツールを使用して、簡単なLSTMのプログラムをプロファイルしました。テンソルフロープロファイリング結果の理解

/gpu:0/stream:all Compute(pid 5)

MatMul_AllCompute

/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)

MatMul_GpuCompute

私の質問:

a)は、各行の意味は何ですが、結果は以下のように示されています。

b)特に/gpu:0/stream:all Compute(pid 5)/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)の違いは何ですか?

c)実行時間が異なる理由、つまり0.072ms0.094msです。

答えて

1

は、ここではエンジニアの一人からの更新です:

'/ GPU:0 /ストリーム:*' timelsinesはCUDAカーネルの実行時間のハードウェアトレースしています。

'/ GPU:0]ラインはそう

+0

(通常ほぼゼロ時間を要する)CUDAストリーム上OPSをエンキューTFソフトウェアデバイスであり、 '/ GPUにおける数:0'の行は、GPUカーネルを含みます立ち上げ時間? – pgplus1628

関連する問題