cuda

    0

    1答えて

    でnvidia-smiがエラーを返すkernal 4.10でubuntu 16.04にcudaドライバ8.0とツールキット375をインストールしようとしましたが、このエラーが発生し続けます。 nvidiaドライバとcudaツールキットはどのようにインストールする必要がありますか? > nvidia-smi > NVIDIA-SMI has failed because it couldn't c

    0

    1答えて

    タイトルとして、カーネルを起動するときに各スレッドが使用するレジスタの数を制限する方法があるかどうかを知りたいとします。 私は各スレッドで多くの計算を行っているので、使用されるレジスタの数が多すぎるため占有率が低くなります。スレッドの並列実行を改善するために使用するレジスタの数を減らそうと思っています。多分、より多くのメモリアクセスを犠牲にしています。 回答を検索しましたが、解決策が見つかりません

    -3

    1答えて

    GeForce GTX 1080 TIおよび\またはGeForce GTX 1080 GPUでcudaMallocPitch APIを使用しているときに ' 4つのGPU(1 1080 TIと3 1080)と2つのCPUを含むPCサーバー全体の一部です。 各GPUは専用のCPUスレッドによって制御され、CPUスレッドはcudaSetDeviceを呼び出し、起動時に正しいデバイスインデックスを呼び出

    0

    1答えて

    cuda.hファイルとcudaライブラリ(特にMLライブラリ)に依存するさまざまなGoライブラリがあります。私はWindows上でこれらのライブラリのいずれかをインストールしようとするたびに、私はエラーを取得する私は何をする必要があるかを認識してい fatal error: cuda.h: No such file or directory //#include <cuda.h> を言って(

    2

    1答えて

    Matlabでは、複素数の1次元配列を入力すると、同じサイズと同じ次元の実数の配列を出力します。 これをCUDA Cで繰り返してみましたが、出力が異なります。 助けてもらえますか? [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0.1512i 0.4500 + 0.0000i 0.4345

    0

    1答えて

    私はcudaプログラミングの新機能です。プログラムをビルドしたいと思います.cuaを使用している.cu関数があります。私はこのプロジェクトに協力しており、プロジェクトは巨大です。プロジェクトの*の.cppファイルを SUBDIRS( src/ThirdParty/Matrice ) set(SRC_CPP_FILES Operation.cpp Operator.cpp

    2

    1答えて

    CUDAを使ったGPU処理でnumbaを使って線形システムを解こうとしています。 すべての関連パッケージをインストールしてテストしたので、GPUとCUDAなどが正しく設定されているようです。 私のコードは次のとおりです。 import numpy as np import time from numba import vectorize, cuda @vectorize(['float

    0

    1答えて

    が正しく実行され、サーバーのGPUデバイスが正しく表示されます。私はクロックCUDAサンプルを実行しようとすると、しかし、私は次のエラーを取得:../../common/inc/helper_cuda.h:1133コードで CUDAクロックサンプル CUDAエラーを= 30(cudaErrorUnknown) "cudaGetDeviceCount(& device_count)" アイデア?

    0

    1答えて

    私はMITKプラットフォームでCUDAを使用しようとしています。私が使っているMITKプラットフォームは、CUDAをサポートしていない2014バージョンです。しかし、私は解決策を示すreplyを見つけましたが、私にとってはうまくいきませんでした。 MITKのCmake構造によると、 "* .cpp"ファイルをfiles.cmakeスクリプトのCPP_FILESフラグに設定すると、gccはソースコー

    0

    2答えて

    大きな問題では単純なテストケースとしてイメージの強度を平均化しています。しかし、私が得る結果は、それを実行するたびに少しずつ異なります。逆に、同じアルゴリズムをCPU上で連続して実行すると、結果は静的になります。のは、GPU上のコードを見てみましょう、 //util.cu __global__ void avgImageDevice(float3 *avg, float3 *d_colorIma