私は最近、並列コードの高速化を目指してP100 GPUを購入しましたが、MATLABコードをCUDAコードに変換する方法を決定する助けが必要です(私はMATLABでは平文gpuarrays
から移動しました) 。私は.ptx
のカーネルとMEX
のファイルを実験しており、両方でいくつかのロードブロッキングを実行しました。MATLABコードのCUDA実装
パラレルコードには、要素累乗、要素単位乗算、FFTおよびIFFT呼び出しがあります。複素数も組み込まれています。
.ptx
は、CUDAカーネルまたはMEX CUDAファイルからコンパイルされたファイルで、FFT、IFFT、exp、およびマルチコールの実行に必要なファイルは簡単ですか?
あなたはcuFFT(http://docs.nvidia.com/cuda/cufft/index.html)を試しましたか? – Matso
私はcuFFTがMATLABのgpuArrray fft呼び出しに組み込まれていると信じています。そのような場合は、その面で改善すべき点はあまりありません。 – Jesse