nvcc

    1

    1答えて

    EDIT:nvccがmalloc(3)をキャストしていないときにエラーが発生したためにCコンパイラの代わりにC++コンパイラを呼び出すため、 char *を呼び出します。私はこのアサーションに導かれています。Invalid converstion from void* to char** EDITEDIT:fileO = fopen(version、 "w")を使用するとうまく動作します。 str

    0

    3答えて

    CUDA SDKでbandwidthTest.cuをコンパイルして実行します。 nvcc -arch=sm_20 bandwidthTest.cu -o bTest cutil_inline.h: no such file or directory shrUtils.h: no such file or directory 私はこの問題をどのように解決できますか?

    0

    1答えて

    CUDA SDK内でbandwidthTestを実行します。 スタックが破損したことが検出されました。エラー。どうすればこの問題を解決できますか? 私はこのプログラムを実行してファイルを作るためにmakeコマンドを使います。私はコード内の何かを変更することはできません。

    1

    1答えて

    私のcudaプログラムをnvccの--ptxas-options = -vフラグを付けてコンパイルして、それらを使用するためにレジスタとメモリの使用量を達成したいCUDA GPU占有率計算機。 エラー:識別子 "atomicAddは、" 私は私のカーネルでatomicAddを使用していた が定義されていません。どうすればこの問題を解決できますか?

    1

    1答えて

    別ファイルとして書き込まれたPTXをインラインPTXに変換する処理中です。別PTXファイルに次のように、私はISAを定義し、ターゲットした以下のようにコンパイラによって生成されたPTXファイルで .version 1.2 .target sm_13 を、PTXをインライン化した後、コンパイラは、ISAとターゲットを指定している: を .version 3.0 .target sm_20

    1

    1答えて

    Parallel NsightでインラインPTXをステップ実行するときにPTXレジスタを表示できますか? インラインPTXにブレークポイントを設定して実行することはできますが、PTXレジスタをホバリングしてもその値は表示されません。私はSASSをオンにすることができ、それらのレジスタにホバリングするとその値は表示されますが、PTXレジスタとSASSレジスタの関係を追跡するのは難しいです。

    2

    1答えて

    CUDAプログラミングガイド(V4.1)を説明について断定指示秒5.4.2でこのコンパイラは、命令の数によって制御する場合にのみ前提 命令で分岐命令を置き換え 分岐条件が一定のしきい値に小さいか等しい: コンパイラは条件が多く 発散縦糸を生産する可能性があると判断した場合、このしきい値は7で、それ以外の場合は、4 です 条件はどのようにして生成できますか多くの発散ワープはありますか?所定の条件は、

    36

    3答えて

    私はCUDAを含むプロジェクトを開始するための助けを募集しています。私の目標は、ネイティブg ++コンパイラでコンパイルできるが、CUDAコードを使用するプロジェクトを作ることです。私はnvccコンパイラでCUDAコードをコンパイルする必要があることを理解していますが、私の理解から、CUDAコードを何らかの形でcubinファイルまたはptxファイルにコンパイルできます。 ここに私の質問は以下のとお

    3

    1答えて

    私はMicrosoft Visual Studio 2008でNVIDIA CUDA 4.1を使用しています。 Intel Parallel Studio XE 2011もインストールされています。 デフォルトでは、NVIDIAのCコンパイラnvcc.exeは、MicrosoftのCコンパイラcl.exeを使用してCコードをコンパイルします。 nvccがIntelのCコンパイラicl.exeを使用

    0

    1答えて

    フロートの配列を更新したCUDAコードを実行しました。私はHow can I compile CUDA code then link it to a C++ project?で議論されたようなラッパー関数を持っています。私のCUDA関数内 私は... int tid = threadIdx.x; for(int i=0;i<X;i++) { //code here } このよう