NVIDIA geforceカードを使用しているときに、CUDAプログラムを実行しようとすると2秒後にエラーが発生します。私はhereを読んで、HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\GraphicsDrivers
にTDRlevel
キーを使うことができます。しかし、私はレジストリにそのようなキーが表示されません。あなた自身を追加する必要がありますか?他の誰かがこの問題を経験したことがありますか?もしそうなら、それをどうやって解決しましたか?ありがとう。GPUカードが2秒後にリセットされる
答えて
モニターに接続されているグラフィックスカードで、cudaカーネルが2秒以上実行されている場合は、タイムアウトが発生します。したがって、これを避けるには、プログラムを2秒の制限を下回る複数のカーネル呼び出しに分割する必要があります。もう1つの選択肢は、モニタに接続されていないグラフィックスカードを使用することです。その後、タイムアウトの制限はありません。
cudaGetDeviceProperties(&prop,i)
prop.kernelExecTimeoutEnabled
上記のコードは、タイムアウトが有効かどうかを示しています。
最後に私はレジストリエントリについても読んだけど、(GNU/Linuxを使っているのでオプションではない)落胆しているようだ。私は間違っているかもしれませんが、私は自分でそのような鍵を追加する必要があると思います。
Windows Vista以降を使用していることを前提としています。
article you linked toには、Microsoft WDDMタイムアウト検出と回復のメカニズムを制御するレジストリキーのリストが含まれています。 talonmiesがコメントしたように、エラーを出すカードではありません。長時間実行しているカーネルを検出し、表示目的でGPUを回復するためにそれを殺すMicrosoft Windows WDDM TDRメカニズムです。
カーネルが長時間実行されている場合、GPUは計算作業で占有されていてディスプレイを更新できませんが、ほとんどの人がそのことを悪いと考えると思います。いくつかの開発者は、システムが数秒間応答しなくなる可能性があると理解して、より長い実行カーネルを開発できるように遅延を増やすことを選択しました。デバッガをWDDM GPUで使用する場合は、TDRを無効にする必要があります(NVIDIA Tesla GPUでWDDMのすべての問題を回避するTCCをサポートしています)。
キーが存在しない場合は作成する必要があります。私がお勧めします:
- TdrLevel 3(すなわち有効)
- TdrDelay 5(すなわち5秒)
- TdrLimitTime 10
- TdrLimitCount 10(すなわち10秒で最大10回のタイムアウト)
代わりに、実行に2番目のGPUを使用するか、カーネルの時間が2秒未満になるように問題を調整します。本当に大きな問題は、専用のGPUで実行する必要があります。これはもちろん、カーネルのバグではないと想定しています!
- 1. Linuxで30秒後にユーザーのアイドル時間が0にリセットされる
- 2. タイマーは60秒後にリセットされます
- 3. BorderStyleプロパティの値がリセットされた後にリセットされます
- 4. リブート後にmysqlグローバルパラメータがリセットされる
- 5. リセット後に角2の入力値が更新されない
- 6. 2秒後にaddChild
- 7. JSを使用してX秒後に消える通知カードを作成するが、ホバー上でタイマーがリセットされる
- 8. バックグラウンドイメージの後にafer 2秒が表示されます
- 9. GPUカードを追加すると自動的にテンソルフローがスケールされますか?
- 10. ミニバッチ処理用の2つの異なるGPUカード
- 11. リセット値は、後に、角2
- 12. jqueryで2秒後にショーが遅れる
- 13. ASP.NETで5秒後にフォームとページの状態をリセットする
- 14. 20秒後にタイマがリセットされますが、ランダムに関数を呼び出すAS3
- 15. Ionic Tinderカード2スタックの最後にカードを返す
- 16. ビルド後にバージョンコードフィールドが自動的に10000にリセットされる
- 17. 2秒後にsetInterval()を停止する
- 18. リセット最後のボタンをクリックした後、カウンター+ n秒の
- 19. GPUパススルー後にホストが表示されない
- 20. 最初のdivの後に常に1秒後に2番目のdivが自動再生される
- 21. 4秒後にJQueryが自動的にクリックされる
- 22. Googleグラフ:ゲージグラフが秒後に最大値に変更される
- 23. ffmpegと複数のGPUカードのCLI
- 24. Reactjs - x秒後にリダイレクトして状態をリセットします。
- 25. アダプタのデータが変更された後にListViewをリセットする
- 26. フィルタ検索後に過渡フィールドがリセットされる
- 27. Androidアプリケーションのロケール設定後にSharedPrefsがリセットされる
- 28. viewDidLayoutSubviewsの後にUIScrollViewのcontentOffsetがリセットされる
- 29. ポストバック後にドロップダウンがリセットされるのはなぜですか?
- 30. RecyclerViewビューのデータがスクロールした後にリセットされる
これは明らかにプログラミングに関する質問ではありません。スーパーユーザーに移行する投票。 – unwind
「エラーが発生しました」というカードではなく、Windows WDDMサブシステムであり、ユーザスペースプログラムがディスプレイGPUを占有するのを事前定義された時間以上禁止するように設計されています。 – talonmies