cusolver

    0

    1答えて

    CUSolverRf sampleで、2530239 nnzマトリックスの疎な196530 x 196530を解決できません。私はまだBのベクトル値を(別の時間のための問題を)試していないと私はすでにエラーが発生している : Error (sorting of the column indecis check failed): (csrColInd 1 =2)>= (csrColInd[2]=2)

    0

    1答えて

    私のプロジェクトは、main.cu jacobian_kernel.cu hermite_kernel.cu cuSolver_LU.cpp Utilities.cuという5つのCUDAファイルで構成されています。最後はthis GitHub repoからUtilities.hというヘッダーファイルとともに適用されます。 3つのヘッダーはargs.h linear_solver.h Utiliti

    0

    1答えて

    私は関数を使用して、三重対角方程式系を解きます。出力は正しいが、関数はマルチ・ストリーミングを正しく使用していない。 nvvpプロファイラは、このソルバへの呼び出しがすべて異なるストリームにあるものの、オーバーラップしないことを示しています。 私は暗黙的な同期を考え、ライブラリ関数はnvvpを介してcudaFreeの呼び出しをたくさん持っていることが判明しました。 この暗黙の同期を回避する方法はあ

    1

    1答えて

    Matlabの複雑な行列を固有値分解するためにcuSolverコードを使用します。(ここで述べたように: http://docs.nvidia.com/cuda/cusolver/#syevd-example1)私はMATLAB CUDAカーネルを使用していますが、cuSolverは、ホスト用としてだけでなく、デバイスのためのコードが含まれているとして、MATLABでcuSolverをインタフェー

    0

    1答えて

    私はCUDA 7.5のマシンにアクセスできますが、cuSolverRFライブラリがないと思います。 バージョンDU-06709-001_v8.0としてマークされている現在のドキュメントには、「cuSolverはおそらくcuSolverRFライブラリが導入されたことを示唆している、共有スパースパターンの行列シーケンスを解決するのに役立つ新しいリファクタリングライブラリを提供しています8.0、しかし、

    0

    1答えて

    2D行列で拡散をシミュレートする簡単なCUDA C++プログラムを作成しました。私はToolkitで提供されているライブラリのいくつかを使用しようとしたときに困っていました。私は非常に効率の悪い行列の転置カーネルをcuBlasからのものと置き換え、また、implCUは線形システムを解くcuSolversの実装で置き換えたいと思います。問題は、関数の使用方法やコンパイル方法がわかりません。 Nvid

    0

    1答えて

    私は現在、いくつかのFortranコードをcudaFortranに移行しています。具体的には、大規模な行列を対角化するためのスペクトル解析が必要です。 [email protected]:~/Skyrmions2017/Project$ pgf90 Main.cuf -lcusolver -Mcuda=cuda8.0 [email protected]:~/Skyrmions2017/Proje

    -1

    1答えて

    OK。私はcuSolverサンプルから取得したコードで手を汚しています。 私はC++をほとんど経験していませんが、何とか元のコードから必要なものを取り除くことができました。 問題は実行しようとするときです。私がコンパイルするリファレンスマニュアルから推薦された通り: nvcc -c att3_cus_lu.cpp -I/usr/local/cuda-8.0/targets/x86_64-linux

    0

    1答えて

    https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/cuda_solvers.h(Geqrf)で参照されていますが、https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/qr_op_float.cc

    0

    1答えて

    私はA * x = bを解こうとしています。ここで、Aは複素数値を持ち、密度があります。 cuSolverDNライブラリのcusolverDnCgeqrf()メソッドを使用して、1つの線形連立方程式のQR分解を行いました。しかし、私はこの処理を高速化するために何度もやりたいのです。 この方法の「一括」バージョンはありますか?あるいは、私が使うことができる別のCUDAライブラリがありますか?