私は有限差分計算を実行するCUDAコードを持っています。このコードはTesla M2090プロセッサでエラーなく正常に動作します。 Tesla T10プロセッサで同じコードを使用すると、多くのエラーが発生します。私は私の結果に多くのゼロを得ています。NVidia CUDA:Tesla T10プロセッサとTesla M2090プロセッサの違い
誰もが(テスラT10に基づく)
私は有限差分計算を実行するCUDAコードを持っています。このコードはTesla M2090プロセッサでエラーなく正常に動作します。 Tesla T10プロセッサで同じコードを使用すると、多くのエラーが発生します。私は私の結果に多くのゼロを得ています。NVidia CUDA:Tesla T10プロセッサとTesla M2090プロセッサの違い
誰もが(テスラT10に基づく)
テスラC1060は、計算能力1.3 テスラM2090のある問題を解決する方法にこれらの二つのアーキテクチャおよびソリューションの違いを知っていますが、フェルミ(に基づいて、多くの新しいアーキテクチャであり、 2.0または2.1) 2つの問題があります。
ソースを2.0または2.1アーキテクチャ用に再コンパイルしていますか? 1.3アーキテクチャ用にコンパイルすると、> = 2.0では動作しません。
CUDAプログラミングガイド3.1.2バイナリ互換性:
バイナリ互換性は次 一から一マイナーリビジョンから 保証はなく、1つのマイナーリビジョン から前のものかの主要な リビジョン間でされます。
また、フェルミは、わずかにのように振る舞います。いくつかの安全でないコードは古いアーキテクチャで正しく動作するかもしれませんが、Fermiではバグをキャッチします。それが疑われる場合は、「Fermi Compatibility Guide」(CUDAツールキットで利用可能)をチェックして、プログラマの観点からのアーキテクチャの主な違いについて知ることができます。