私には特別な問題があります。batchedgemmソースコード?
私はCUDA 4.1を使用して、特にbatchedgemm
を使って自分のMacBookで開発したリサーチコードをいくつか持っています。私は今、私が別の機関から貸し出しているgpuのクラスター上で実行しなければなりません。
私の問題は、クラスタにはCUDA 4.0しかインストールされておらず、高速でアップグレードすることには消極的です。
私はどこでもbatchedgemmのソースを入手して4.0で動作するようにコンパイルすることができますか?
私はバッチ乗算を行うために自分のカーネルを書いたことがありますが、ライブラリよりも約10倍遅いオーダーを実行します - 私は自分のつま先ではなく偉大な男性の肩に立たせたいと思います。