2011-06-28 8 views
1

私は有限差分計算を実行するCUDAコードを持っています。このコードはTesla M2090プロセッサでエラーなく正常に動作します。 Tesla T10プロセッサで同じコードを使用すると、多くのエラーが発生します。私は私の結果に多くのゼロを得ています。NVidia CUDA:Tesla T10プロセッサとTesla M2090プロセッサの違い

誰もが(テスラT10に基づく)

答えて

5

テスラC1060は、計算能力1.3 テスラM2090のある問題を解決する方法にこれらの二つのアーキテクチャおよびソリューションの違いを知っていますが、フェルミ(に基づいて、多くの新しいアーキテクチャであり、 2.0または2.1) 2つの問題があります。

ソースを2.0または2.1アーキテクチャ用に再コンパイルしていますか? 1.3アーキテクチャ用にコンパイルすると、> = 2.0では動作しません。

CUDAプログラミングガイド3.1.2バイナリ互換性:

バイナリ互換性は次 一から一マイナーリビジョンから 保証はなく、1つのマイナーリビジョン から前のものかの主要な リビジョン間でされます。

また、フェルミは、わずかにのように振る舞います。いくつかの安全でないコードは古いアーキテクチャで正しく動作するかもしれませんが、Fermiではバグをキャッチします。それが疑われる場合は、「Fermi Compatibility Guide」(CUDAツールキットで利用可能)をチェックして、プログラマの観点からのアーキテクチャの主な違いについて知ることができます。