thrust

    7

    3答えて

    私はCUDA(通常1000000要素)を使ってGPUに符号なし整数の配列を格納しています。私は配列内のすべての数字の出現を数えたいと思います。わずか数(約10)しかありませんが、これらの数値は1から1000000に及ぶことがあります。数字の9/10は0、私はそれらの数を必要としません。結果はこのようなものになります。 58458 -> 1000 occurences 15 -> 412 occu

    1

    1答えて

    ソートを使ったアルゴリズムを実装しました。私はThrust :: sort_by_keyを試してみたところ、10^7要素の配列をソートするのに0.4秒かかりました。 私は、ビートソートネットワークがThrust :: sort_by_keyよりも速くなければならないと考えました。しかし、上記の同じアレイをソートするには、ビートソートに約2.5秒かかりました。 SDKで提供されているビートソートソー

    13

    3答えて

    私は、ベクトルから生ポインタに移動する方法を理解していますが、後ろへ移動する方法についてのビートをスキップしています。 // our host vector thrust::host_vector<dbl2> hVec; // pretend we put data in it here // get a device_vector thrust::device_vector<dbl2

    1

    2答えて

    安全に割り当てることができるthrust::device_vector<T>の最大サイズを判断する方法はありますか?

    14

    2答えて

    最大(最小)要素の値だけでなく位置(res.valおよびres.pos)の取得方法を教えてください。 thrust::host_vector<float> h_vec(100); thrust::generate(h_vec.begin(), h_vec.end(), rand); thrust::device_vector<float> d_vec = h_vec; T res = -1

    7

    3答えて

    3同じサイズの配列(300.000以上の要素)があります。浮動小数点数の1つの配列とインデックスの2つの配列。だから、各番号のために私は2 IDを持っています。 すべての3アレイはすでにGPUグローバルメモリにあります。私はそれに応じてIDのすべての番号を並べ替える必要があります。 私はこの作業を行うためにスラストライブラリを使用する方法はありますか?推力図書館よりも良い方法はありますか? もちろ

    33

    3答えて

    私は推力の初心者です。スラストのプレゼンテーションとサンプルはすべてホストコードのみを表示しています。 自分のカーネルにdevice_vectorを渡すことができるかどうか知りたいですか?どうやって? "はい"の場合、カーネル/デバイスコードの内部で許可されている操作は何ですか?

    0

    2答えて

    私は3つの配列(x、y、prb)と1つのスカラを入力とし、3つの配列(P1、Pt1、Px)を出力する関数を並列化しようとしています。 元のCコードは、(外れ値とEは取るに足らないです)ここにある:ここで #include <stdio.h> #include <math.h> #include <stdlib.h> #define max(A, B) ((A) > (B) ? (A) : (

    3

    1答えて

    私の計画は、Pearsonsの相関を使用して距離行列を計算し、距離行列から各ノード(q = ln(n))についてq最近傍を取得し、ベクター。私はC++で、相関関数のループ内でSTL優先順位キューを使用していました。 しかし、GPUで行う方法はありますか? 誰もがGPUでプライオリティキューを実装するためにどのよう (おそらく推力は私のために容易になります!)どのように私はGPUで同じことを行うこと

    1

    1答えて

    私は構造体の配列を持っており、それらを並べ替える必要があります。私はThrust :: sortを使用していますが、うまくいきます。人々はCUDPPの方がソーティングが速いと私に伝えていますが、構造配列を直接ソートすることはできません。 Here彼らはCUDPPを使って構造体配列をソートする方法を説明しましたが、リソースを消費すると思います。 すばやくソートを行うことに関するご提案はありますか?こ