私はDell PrecisionラックにUbuntu Preciseを搭載しており、2台のTesla C2075に加えてディスプレイデバイスであるQuadro 600を搭載しています。私は最近、私のデスクトップコンピュータでいくつかのテストを終え、今はワークステーションにものを移植しようとしました。CUDA SDKの例では、複数のgpuシステムでさまざまなエラーが発生する
CUDAは存在しないので、this guideに従ってインストールし、SDK Makefilesをthis suggestionsに適合させました。
私が今直面しているのは、1つのサンプル(私は10種類のサンプルのようにテストしました)が実行されていないことです。それらは私が取得していますエラーです:
[deviceQuery] starting...
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 10
-> invalid device ordinal
[deviceQuery] test results...
FAILED
> exiting in 3 seconds: 3...2...1...done!
[MonteCarloMultiGPU] starting...
CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU
==================
Parallelization method = threaded
Problem scaling = weak
Number of GPUs = 0
Total number of options = 0
Number of paths = 262144
main(): generating input data...
main(): starting 0 host threads...
Floating point exception (core dumped)
[reduction] starting...
reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal.
[simplePrintf] starting...
simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal.
としてすることができますSE
cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device.
残念ながら、唯一の解決策は、私はデバイスをチェックすることが示唆見つけることができた:エラーの電子ほとんどは問題があるマニュアルによると、エラーコード10を返しcudaGetDeviceCountコールに問題の方を向いています電源プラグ。私はそれをして、何も間違っていませんでした。ワークステーションの再起動も役に立ちません。
私の設定についてもっと詳しく説明します。ちょうどコメントを残す!
これは、StackOverflowのトピックではありません。 '/ dev/nvidia *'デバイスファイルがあるかどうかを確認することをお勧めします。そうでない場合は、手動で作成する方法については、Linuxスタートガイドを参照してください。 – talonmies
@talonmies私の開発者には 'nvidia0'と' nvidiactl'があります。どのくらいのファイルがあるはずですか? –
GPUごとに1つ、システムには3つが必要です。 – talonmies