私はcudaとMPIを使用するプロセスを監視しようとしていますが、これを行う方法はありますか?CUDAを使用しているGPUのトップコマンド
答えて
(おかげで-lで先端のため@jmsuする)のようなので、私はこの情報を組み合わせたものを認識してないんだけど、あなたは生のデータを取得するためにnvidia-smi
ツールを使用することができます。
$ nvidia-smi -q -g 0 -d UTILIZATION -l
==============NVSMI LOG==============
Timestamp : Tue Nov 22 11:50:05 2011
Driver Version : 275.19
Attached GPUs : 2
GPU 0:1:0
Utilization
Gpu : 0 %
Memory : 0 %
hereから最新の安定したCUDAドライバ(4.2)をダウンロードしてインストールしてください。 Linuxの場合、nVidia-smi 295.41は、あなたが望むものだけを提供します。 nvidia-smi
を使用します。
[[email protected] release]# nvidia-smi
Wed Sep 26 23:16:16 2012
+------------------------------------------------------+
| NVIDIA-SMI 3.295.41 Driver Version: 295.41 |
|-------------------------------+----------------------+----------------------+
| Nb. Name | Bus Id Disp. | Volatile ECC SB/DB |
| Fan Temp Power Usage /Cap | Memory Usage | GPU Util. Compute M. |
|===============================+======================+======================|
| 0. Tesla C2050 | 0000:05:00.0 On | 0 0 |
| 30% 62 C P0 N/A/N/A | 3% 70MB/2687MB | 44% Default |
|-------------------------------+----------------------+----------------------|
| Compute processes: GPU Memory |
| GPU PID Process name Usage |
|=============================================================================|
| 0. 7336 ./align 61MB |
+-----------------------------------------------------------------------------+
EDIT:最新のNVIDIAドライバでは、このサポートは、テスラカードに限定されています。
別の有用な監視アプローチは、あなたのGPUを消費するプロセスでろ過ps
を使用することです。
ps f -o user,pgrp,pid,pcpu,pmem,start,time,command -p `lsof -n -w -t /dev/nvidia*`
は、それはすべてのNVIDIA GPU-利用プロセスおよびそれらに関するいくつかの統計を紹介します:私はこの1つをたくさん使用しています。 lsof ...
は、現在のユーザが所有するNVIDIA GPUを使用するすべてのプロセスのリストを取得し、ps -p ...
は、これらのプロセスの結果をps
と表示します。 ps f
は、子/親プロセスの関係/階層に適した書式を示し、-o
はカスタム書式を指定します。これはちょうどps u
を実行するのに似ていますが、プロセスグループIDを追加して他のいくつかのフィールドを削除します。
nvidia-smi
以上の利点の1つは、プロセスフォークとGPUを使用するメインプロセスが表示されることです。
ただし、1つの欠点は、コマンドを実行するユーザーが所有するプロセスに限定されていることです。任意のユーザーが所有するすべてのプロセスまで開くには、lsof
の前にsudo
を追加します。
最後に、それをwatch
と組み合わせて、継続的なアップデートを取得します。
watch -n 0.1 'ps f -o user,pgrp,pid,pcpu,pmem,start,time,command -p `sudo lsof -n -w -t /dev/nvidia*`'
:
Every 0.1s: ps f -o user,pgrp,pid,pcpu,pmem,start,time,command -p `sudo lsof -n -w -t /dev/nvi... Mon Jun 6 14:03:20 2016
USER PGRP PID %CPU %MEM STARTED TIME COMMAND
grisait+ 27294 50934 0.0 0.1 Jun 02 00:01:40 /opt/google/chrome/chrome --type=gpu-process --channel=50877.0.2015482623
grisait+ 27294 50941 0.0 0.0 Jun 02 00:00:00 \_ /opt/google/chrome/chrome --type=gpu-broker
grisait+ 53596 53596 36.6 1.1 13:47:06 00:05:57 python -u process_examples.py
grisait+ 53596 33428 6.9 0.5 14:02:09 00:00:04 \_ python -u process_examples.py
grisait+ 53596 33773 7.5 0.5 14:02:19 00:00:04 \_ python -u process_examples.py
grisait+ 53596 34174 5.0 0.5 14:02:30 00:00:02 \_ python -u process_examples.py
grisait+ 28205 28205 905 1.5 13:30:39 04:56:09 python -u train.py
grisait+ 28205 28387 5.8 0.4 13:30:49 00:01:53 \_ python -u train.py
grisait+ 28205 28388 5.3 0.4 13:30:49 00:01:45 \_ python -u train.py
grisait+ 28205 28389 4.5 0.4 13:30:49 00:01:29 \_ python -u train.py
grisait+ 28205 28390 4.5 0.4 13:30:49 00:01:28 \_ python -u train.py
grisait+ 28205 28391 4.8 0.4 13:30:49 00:01:34 \_ python -u train.py
また、あなたのコンピュータを占有するコンピューティングプログラムのPID 'sudo 'なしで全てのユーザのGPUを以下のようにします:' nvidia-smi --query-compute-apps = pid --format = csv、noheader' –
使用引数 "--query-コンピュート・アプリケーション="
nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv
をだから、最後に、それは次のようになります
詳細については、
nvidia-smi --help-query-compute-app
- 1. CUDAでのGPU使用率が低い
- 2. CUDAプログラミング:レガシーGPUをCUDA 7.5ツールキットで使用するには?
- 3. 複数のCUDA GPUの使用
- 4. CUDAのGPU CPU
- 5. GPUのCUDAカーネルスケジューラ
- 6. CUDAリモートGPU
- 7. 高負荷ストリームの予測時にCUDA GPUを使用する
- 8. CUDAを使用したマルチGPUプログラミング戦略
- 9. TensorFlow GPU CUDA CUDDNエラー
- 10. MatlabとGPU/CUDAプログラミング
- 11. CUDAをサポートするGPUもOpenCLをサポートしていますか?
- 12. cuda gpu:用語の明確化
- 13. CUDA nvidia Fermi GPUシステム用Visual Studio 2017インテグレーション
- 14. CUDAを使用したGPUアクセラレーションでDarknetフレームワークが開始されない
- 15. CUDA 8.0でAlea.cuBase/Alea GPUを使用できますか?
- 16. GPUプログラミング、CUDAまたはOpenCL?
- 17. nVidia CUDA with GPU with PCI interface
- 18. Tensorflow with GPU and CUDA v5.5
- 19. cuda gpu cudaMemcpyToSymbolでメモリを解放する
- 20. SLIをサポートしていないシステムで2つのNVIDIA gpuカードをCUDA計算に使用できますか?
- 21. CUDAを使用したGPU上の高度な暗号化標準
- 22. CUDAを使用してGPU上でMATLABコードを実行するにはどうすればよいですか?
- 23. Maxwell GPUで計算機能3.7用にコンパイルされたCUDAを使用していますか?
- 24. GPUでの並列処理 - CUDA/OpenCL
- 25. KVMのCPUとしてGPUを使用
- 26. Net :: SSH2を使用したトップコマンドの出力を取得
- 27. PCI-E用CUDA - GPU用メモリクロック速度対Gbps対
- 28. Apache Spark - ローカルでのCUDA GPUの最適化と利用
- 29. awkを使用したトップコマンドのフィールド区切り
- 30. Keras(Theanoバックエンド+ GPU + CUDA)がPyDevで動作しない
-lを追加すると、GPUとメモリ使用率を継続的に効果的に監視して更新することができます。 – jmsu
GPUのutilizacionを実行するとN/Aと表示されたらどうなりますか? – natorro
@natorro nVidiaは一部のカードのサポートを外したようです。このリンクをチェックしてくださいhttp://forums.nvidia.com/index.php?showtopic=205165 – jmsu