タイプの計算のための重要な改善を約束するOpenCLで利用可能な怒っ機能に関してれるこの質問:乗算と追加機能
* bの+怒っ(A、B、Cとして使用する場合は、C
)、cl-mad-enableでコンパイルします。
非常に大きなサイズのmadを使用してa + b * c + d * eという形式の計算を試みましたが、大幅な改善が期待されていました。驚いたことに、同じ時間がかかりました。
誰かがこれを経験していれば、私はいくつかの洞察に感謝します。私はリソースの大部分が怒りのために賞賛に満ちているので、うまくいくはずのジストを持っています。注:私が使用しているデータ型はすべてdouble型ですが、重要な場合は、私の使用方法が大きな精度の損失となりました。
GPUは実際に倍精度をサポートしていますか?彼らの多くはフロートだけをサポートしています。 –
デフォルトではなく、cl_khr_fp64を有効にすることで、私はそれらを操作できます。ポイントがあるかもしれません、私はフロートに変換してチェックします。コードは非常に大きいので、時間がかかるでしょう。私は何かがあると私はコメントします。 –