パフォーマンスのためにOpenCLを使用して物理シミュレーションアルゴリズムをGPUに移植したいと思います。私はOpenCLに関する経験がなく、私は周りを見ています。計算は、ほとんどが小規模の高密度マトリックス(3x3)とベクトル積、交差積などです。opencl matrix library
このような基本操作には、「標準」/推奨ライブラリがありますか? OpenCLのクラスを持っていないとして、私は、例えば
mmul(a,mtrans(b))
の代わりa*b.transpose()
を記述する必要があります、オペレータがなどの過負荷を、私は確かに(時間ではなく、それはinefficentだろう)コード行列の乗算と反転に自分自身をしたくない?
OpenCL(またはプリプロセッサ)の拡張/進化がありますか?その表記をより数学的にするには?私はfortran年に戻る印象を持っています。あなたの質問に答えるために(私はCUDAがある知っているが、それはベンダーバウンドである)
申し訳ありませんが、私はFortranを心に留めていました(私が当時プログラミングしていたわけではありません)。つまり誰かが自分のために書くのではなく、良い実装をする前でした。類推すると、私は、Pythonがそのような普及した言語である理由の1つ、「電池が含まれている」と思う。 – eudoxos