2011-08-03 8 views
0

私は、外出してカードを買うことなく、別のGPGPUの共有メモリのマウントを見積もる方法があるのだろうかと疑問に思っていましたか?openclハードウェアのローカルmem

私は現在、ノートパソコン と16K + 32K = 48Kの共有メモリを持つGTX 480の16K共有メモリを備えたGTS 330Mを持っています。

テスラカードを取得すれば、それがGTXカードと同じであれば、より多くの共有mem prブロックが得られるかどうかを知りたいと思います。

これをどのように把握していますか?私はNVIDIAのサイトの仕様でそれを見ることができません...おそらくAMDのGPGPUは良いでしょう、どのようにこれを把握しますか?

私はデータがPCI-Eバスを介して転送する必要があるとして、誰かが

+1

Amazon EC2 ClusterのGPUインスタンス(Tesla M2050のペアでは$ 2.10 /時間)を取得し、テストプログラムを実行して、パフォーマンスの仕方や購入する価値があるかどうかを判断します。 AMDとNVidia GPUの相対的な性能を見積もることは、アーキテクチャが非常に異なるため非常に困難です。 – user57368

答えて

2

NVIDIAハードウェアの場合、すべてのCUDA/OpenCL対応カードの共有メモリ構成については、CUDA 4.0プログラミングガイドの付録Fで説明しています。

Ferm Telsaカードに関するご質問にお答えするには、GTX 480 - 16kbまたは48kbの共有メモリと同じ共有メモリ構成があり、実行時に選択することができます。

+1

同じコンピューティング能力を持つすべてのNVIDIA GPUは、SMごとに同じ量の共有メモリを持ちます。現在、CC> = 2.0 == 48KBを意味しています。 CC <2.0 == 16KB。 – harrism

2

を助けることを願って、別のデバイス上のグローバルメモリは、CPUのメモリを使用して同じくらい遅いです。入力データを分割することができず、メモリがボトルネックよりも速度が速い場合は、Intel SandyBridgeやAMD Fusionなどのベクトル対応CPUでOpenCLを使用してみてください。

+0

私が見ている目的のために、私はわずかな初期データだけを使ってGpu上のデータを生成することができます。だから、バスのボトルネックの問題を修正する必要があります。 –

1

JavaCLハードウェアレポートhttp://nativelibs4java.sourceforge.net/webstart/OpenCL/HardwareReport.jnlpを実行しますか?

+0

-1これは標準のosxで動作しないものです。これはすでに持っているハードウェアだけを昆虫にしているようです。 –

+0

Apple JDK/JRE :( –

+0

)をインストールする必要があります。このステートメントを修正し、JavaCL Hardware ReportがMacで動作することを指摘しました(2012年1月現在)。ただしMacBookでは、離散的なビデオカードを使用するか、クラッシュする可能性がありますまた、それはあなたがサポートしようとしていた何かを見るために、カードを持っている必要があります。 – Pridkett