2017-07-14 22 views
0

私はA * x = bを解こうとしています。ここで、Aは複素数値を持ち、密度があります。cuSolverDNまたは別のCUDAライブラリは、A * x = bを解くために密行列のためのバッチバージョンのQR分解を持っていますか?

cuSolverDNライブラリのcusolverDnCgeqrf()メソッドを使用して、1つの線形連立方程式のQR分解を行いました。しかし、私はこの処理を高速化するために何度もやりたいのです。

この方法の「一括」バージョンはありますか?あるいは、私が使うことができる別のCUDAライブラリがありますか?

+1

"この方法の「バッチ」バージョンはありますか?あなたはcusolver [documentation](http://docs.nvidia.com/cuda/cusolver/index.html#cuds-function-reference)を見ましたか? "あるいは私は使用できる別のCUDAライブラリがありますか?" [here](https://stackoverflow.com/help/on-topic)から:「ブック、ツール、ソフトウェアライブラリ、チュートリアル、またはその他のオフサイトリソースを推奨するかどうかを尋ねる質問は、スタックオーバーフローのトピックではありません" –

答えて

1

あなたはマグマを使用することができますがQRをバッチ処理: http://icl.cs.utk.edu/projectsfiles/magma/doxygen/group__group__qr__batched.html#details

またはNvidiaのは、ライブラリをバッチ処理: https://devblogs.nvidia.com/parallelforall/parallel-direct-solvers-with-cusolver-batched-qr/

を、私は彼らのためのpythonラッパーがまだあるかどうかを確認していません。 MagmaまたはNvidiaのいずれかで、現在利用可能な多くのソルバのバッチバージョンを追加したいと考えています。

あり、単一の標準はまだありませんが、それは進行中である、それはバッチBLASのワークショップで議論されています。ここ

http://www.netlib.org/utk/people/JackDongarra/WEB-PAGES/Batched-BLAS-2017/ 、ここで:

http://www.netlib.org/utk/people/JackDongarra/WEB-PAGES/Batched-BLAS-2016/

ドラフトの準備ができていると私はすぐに標準的なバッチBLASがあることを願っています。

関連する問題