並列nsightを使用して、非合体読み取り/書き込みおよびバンク競合の数を知る方法はありますか?
さらに、nsightを使用しているときに、プロファイラーは何ですか?私のプログラムが遅くなる重要なフィールドは何ですか?Nsightを使用してバンク競合と合体を判断する
答えて
私はNSightを使用していないが、あなたはプロファイラで見てみましょう典型的な分野は、基本的には、以下のとおりです。
- メモリ消費
- 具体的な機能
で過ごした時間、 CUDAを使用すると、GPUの占有に注意する必要があります。
他の興味深い値は、コンパイラがローカル変数をレジスタまたはローカルメモリに設定した方法です。
最後に、GPUとの間でデータをやりとりする時間を確認し、計算時間と比較します。
銀行間の競合については、warp serialization
を見る必要があります。 hereを参照してください。メモリ合体<の監視について
とhere is a discussion - 基本的にはあなただけのGlobal Memory Loads/Stores - Coalesced/Uncoalesced
とフラグUncoalesced
を監視する必要があります。
M. Tibbitsは、基本的に、銀行の競合や非合併のメモリ取引について知っておくべきことを答えました。あなたがいるかどうかを判断する
- 使用アプリケーションやシステムトレース:私のプログラムを遅くする原因となります(Nsightプロファイラを使用している場合)を見て重要なフィールド/物事が何であるかの質問については
CPUバウンド、メモリバウンド、またはカーネルバウンド。これは、タイムラインを見て行うことができます。
a。 CPU境界 - カーネルやメモリのコピーが発生していないが、アプリケーションスレッド(スレッド状態)が緑色である大きな領域が表示されます。
b。メモリバウンドカーネルは、デバイスとの間のメモリ転送でブロックされます。 Memory Rowを見ることでこれを見ることができます。メモリコピーに多くの時間を費やしている場合は、CUDAストリームを使用してアプリケーションをパイプライン化することを検討する必要があります。これにより、メモリー転送とカーネルをオーバーラップさせることができます。コードを変更する前に、転送とカーネルの継続時間を比較し、パフォーマンスが向上することを確認する必要があります。
c。 Kernel bound - アプリケーションの時間の大半がカーネルの処理を完了するのに費やされた場合、 "Profile"アクティビティに切り替えてアプリケーションを再実行し、ハードウェアカウンタの収集を開始してカーネルの実際の実行時間もっと早く。
- 1. msbuild sonarquberunnerを使用してマージ競合
- 2. 競合ネットを使用して過剰適合を防ぐ
- 3. プロセスRedirectStandardErrorとRedirectStandardOutputを使用した場合の競合条件
- 4. パンダを使用してテキストからコンテキストを判断する
- 5. PHPを使用してユーザーテキストのデータベースのトレンドを判断する
- 6. Tensorflowでtf.assignを使用する場合の競合条件
- 7. Linqクエリを使用して競合を見つける
- 8. 文字列の整合性を判断する - PHP
- 9. JavaScriptを使用してファイルサイズを判断してください
- 10. JUnit Test ExpectedExceptionとTestWatcher @ Ruleの両方を使って競合と競合の両方をテストします
- 11. 2つのバージョンのSQL Serverを使用した照合競合
- 12. RhomobileとAppceleratorは競合他社と競合していますか?
- 13. スクリプトを使用して競合を延期したい
- 14. CustomPouchError 409競合しているドキュメントの更新の競合
- 15. Ivy strict conflict managerを使用している場合、パッケージが自己と競合しています
- 16. マージ非競合競合イベント
- 17. Sementic UI AccordionとJQuery UI Accordionの両方を使用する場合の競合
- 18. コアモーションを使用して電話機の高度と方位を判断する
- 19. NSUrlConnectionを使用して競合条件でビートを取得
- 20. Stataの競合リスクと競合する障害
- 21. GraphqlJS-タイプの競合 - 共用体またはインタフェースを使用できません
- 22. WKessionDelegateと競合するWKWatchConnectivityRefreshBackgroundTask
- 23. read_cfg()と競合するタイプ
- 24. ブーストと競合するラッパー?
- 25. フロントエンドでwp_editor()を使用したときのjQueryの競合
- 26. Drupal 7のJavascript:JMpress.jsを使用したときの競合
- 27. プログラミングでdplyr合体を使用する
- 28. MavenとSVNを使ってEclipse Marsで競合する?
- 29. javascriptを使用してIDが競合するSVGを挿入する
- 30. JbossでHornetQを使用する場合の競合状態を避ける