4
This exampleは、テンソルフロープログラムのプロファイル方法を示しています。私はこのツールを使用して、簡単なLSTMのプログラムをプロファイルしました。テンソルフロープロファイリング結果の理解
/gpu:0/stream:all Compute(pid 5)
/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)
私の質問:
a)は、各行の意味は何ですが、結果は以下のように示されています。
b)特に/gpu:0/stream:all Compute(pid 5)
と/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)
の違いは何ですか?
c)実行時間が異なる理由、つまり0.072ms
と0.094ms
です。
(通常ほぼゼロ時間を要する)CUDAストリーム上OPSをエンキューTFソフトウェアデバイスであり、 '/ GPUにおける数:0'の行は、GPUカーネルを含みます立ち上げ時間? – pgplus1628