dynamic-parallelism

    1

    1答えて

    に存在している場合、私は、次の最小限の.cuファイル #include <cuda_runtime_api.h> #include <cublas_v2.h> #include <cstdio> __global__ void test() { cublasHandle_t handle = nullptr; cublasCreate(&handle); } i

    0

    1答えて

    Iは、以下のカーネル、分割でダイナミック並列処理を使用して、整数配列の最大値を取得し、ファッションを征服するものと動的な並列性をテストしています: __global__ void getMax(int * arr, int ini, int fin, int * maxv) { if (ini >= fin) return; if (fin-ini==1) {

    -1

    1答えて

    動的並列処理をテストするために、簡単なコードを書き、GTX1080で以下のコマンドを使用してコンパイルしました。 nvcc -arch=sm_35 -dc dynamic_test.cu -o dynamic_test.o nvcc -arch=sm_35 dynamic_test.o -lcudadevrt -o dynamic_test ただし、出力が期待どおりではありません。子カーネル

    0

    1答えて

    カーネル内で複数のベクトルドットを実行するコードを記述しようとしています。私はcublasSdot関数を使用しています。cublasベクトルドット積を実行するライブラリです。これは私のコードです: using namespace std; __global__ void ker(float * a, float * c,long long result_size,int n, int m) {