pycuda

    0

    1答えて

    私たちは4つのGPUデバイスしか持っていません。私たちは4人以上のユーザーがcudaプログラムを実行しているので、プログラムを実行する前に、どのデバイスがビジーでないかを確認したい、またはメモリを割り当てられません。しかし、私はこのタグを取得する関数を見つけることができません。私たちは "cudaSetDevice()"と呼ばれるデバイスをいつ使用するかを知っているので、デバイスごとにタグが必要で

    1

    1答えて

    私はpyCUDAをCUDAプログラミングに使用しています。カーネル関数内で乱数を使う必要があります。 CURANDライブラリはその内部で動作しません(pyCUDA)。 GPUには多くの作業が必要なので、CPU内で乱数を生成してからGPUに転送するとGPUを使用する動機が失われます。 補足質問: 1つのブロックと1つのスレッドを使用して、GPU上のメモリを割り当てる方法はあります。 私は複数のカーネ

    1

    1答えて

    私はcudaとpycudaにはかなり新しいです。 同じ配列をn回単に "繰り返す"ことによって、配列(1xd)から行列(次元nxd)を作成するカーネルが必要です。たとえば、n = 4、d = 3とし、配列は[1 2 3] であれば、私のカーネルの結果は次のようになります。 [1 2 3 1 2 3 1 2 3 1 2 3] (行列4x3の)。 基本的に、それは私は以下のコード書いたnum

    0

    1答えて

    私はGPUでPythonループを並列化したいのですが、pyCUDAを使用したくないのです。自分で多くのことを行う必要があるからです。私はOpenACCのようなものを、Pythonが単純な並列化を実装するためにC++のように探していますが、そのようなことはないようです。ですから、私はC++でOpenACCを使用し、次にコードのようにpthonスクリプトを呼び出すことを考えています。これは動作しますか

    0

    1答えて

    私はここにあるコードを適合させようとしています: https://wiki.tiker.net/PyCuda/Examples/ThrustInterop ... cudaストリームを使用しています。 (Iは、C++に新たなんだ、とだけCUDAと数週間の経験を持っていることを言い訳してください。) 私の主な試みとスティッキングポイントが受信するので、同じようNVCC機能を調整するの線に沿ってきまし

    2

    1答えて

    私のシステムがあります353.90 CUDAツールキット:7.5 Visual Studio:Visual Studioコミュニティ2013(日本語版) pycuda installaに使用したバイナリファイルン:pycuda - 2016年1月2日+(http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycudaからダウンロード)cuda7518-cp35-c

    0

    1答えて

    現在、PyCUDAを使用して固定メモリを持つドットプロダクトを開発中です。そして、大きな配列には問題があります。私が働いている : NVIDIAのGTXは1060 CUDA 9.1 PyCUDA 2017年1月1日 コードは次のとおりです。 #!/usr/bin/env python import numpy as np import argparse import math impor

    -1

    1答えて

    私はGPU上の画像に対してローカルバイナリパターンを計算しようとしていました。しかし、CPUとGPU上で同様のアルゴリズムを実行することによって得られる結果は、異なる結果を生み出しています。あなたは問題を理解するのを助けることができますか?以下 は、私が実行しようとしていたコードの抜粋です: from __future__ import division from skimage.io impo

    2

    1答えて

    PyCUDAを使用してGPUで実行できる2つの配列の等価チェッカーを構築しようとしています。 PyCUDA GPU Arrays documentation pageに示されている例に従うと、私は自分の実装を書こうとしました。しかし、以下のコードは算術演算で期待通りに機能しますが、 "z[i] = x[i] + y[i]"、等価チェッカオペランド"z[i] = x[i] == y[i]"の誤った出

    0

    1答えて

    PyCudaコードを実行しています。グラフィックカードのプロパティ(ワープのサイズ、ブロックあたりの最大スレッド数など)を取得したいと思います。 だから私は、このページに行ってきました:https://documen.tician.de/pycuda/driver.html をそして、私はこの見た:その後、私は自分のコードに次のように書いた を: import time import numpy