cudpp

    1

    1答えて

    私はcudppを使いたいです。特定のコンピューティング機能のデバイスでのみ動作するのであれば私は興味がありますか? 「はい」の場合、下限は何ですか? 私は彼らのハッシュテーブルの実装コードでこのエラーメッセージが見つかりました:私は、彼らがどの計算バージョンを知らない 「testHashTableでcudppHashTable呼び出しでエラー(お使いのデバイスは、少なくとも計算バージョン2.0 \

    1

    1答えて

    私は構造体の配列を持っており、それらを並べ替える必要があります。私はThrust :: sortを使用していますが、うまくいきます。人々はCUDPPの方がソーティングが速いと私に伝えていますが、構造配列を直接ソートすることはできません。 Here彼らはCUDPPを使って構造体配列をソートする方法を説明しましたが、リソースを消費すると思います。 すばやくソートを行うことに関するご提案はありますか?こ

    0

    1答えて

    推力/ cudappのk番目の最小要素アルゴリズムの実装を探しています。私はそれのためにgoogledしかしそれを見つけるように見えない。そのようなアルゴリズムが存在するかどうかは知っていますか? 並べ替えがありますが、k番目に小さいとは言えません。

    2

    1答えて

    私はクラスタ上のいくつかのプロセスの中で大きな配列を配布するmpiプログラムを持っています。 各プロセスは、配列要素の合計を計算し、その結果をhostに返します。 各プロセスの配列要素に対して並列接頭辞スキャンを実行します。 CUDPPで可能かどうかは考えてください。 ? openmpiとcudppを一緒に使った人はいますか?

    5

    1答えて

    私はCUDA/Thrust/CUDPPを使用しています。私が理解しているように、ストリーム圧縮では、配列内の特定の項目が無効であるとマークされ、次に「削除」されます。 ここで「除去」とはどういう意味ですか?元の配列Aを想定し、2つの要素が無効である(何らかの条件により、我々は提供することができる)場合、システムが格納するGPUメモリ内のサイズ4の新しいアレイを作成していその後 長さ6を有します正し

    1

    1答えて

    CUDAcudppScanを使用して、要素の配列の接頭辞合計を計算しています。 入力データサイズが小さいとうまくいく。 しかし、データサイズが約700,000を超えると、出力のいくつかの要素が間違った値になります。 私はすべて1の配列のcudppScanを実行しているので、出力は1, 2, 3, 4, ...である必要があります。ここで は私のコードです: void runTest(int ar