CUDA：HtoDとDtoHの帯域幅の相違

さらに別の帯域幅関連の質問。私はDevice-to-Host帯域幅のプロットとHost-to-Deviceの帯域幅のプロットが似ていると予想しましたが、両者の間には大きな違いがあることがわかりました。同じルートに従うことを考慮すると、有効帯域幅は同じでなければなりません。テストベッドは、2つのソケットに合計12個のIntel Westmere CPU、4個のPCIe Gen2 Expressスロットを備えた4個のTesla C2050 GPUで構成されています。 NVidiaコードサンプルのbandwidthtestプログラムを使用します。 enter image description here CUDA：HtoDとDtoHの帯域幅の相違

ホストからデバイスへのcudamemCpyのオーバーヘッドはどのくらいですか？

出典

2011-08-11 Sayan

興味深い質問です。私はM2050の場合と同様の結果を得て、S1070の場合は逆の結果を得ているようです。結果は非常によく似ています - あなたのものと同じですが、私も矛盾がどこに来るのか疑問に思っています。 – Patrick87

まず、私はこれら2つの曲線がと同じであると言います。 CUDAとグラフィックス（OpenGL/D3D）の両方のテストが含まれているので、私はそれが何かだとは思わない（特にこの小さな違い）あなたに関係するはずです。

あなたの他のPCI-e帯域幅に関する質問と同様に、答えは似ています。ドライバーはさまざまなタイプとサイズの転送に異なる戦略を使用して最高のスループットを可能にしようとします。

実際のスループットは、使用しているホストチップセットのGPUのタイプや多くの要因（、特に）によって異なります。

出典

2011-08-11 23:49:12 harrism

答えをありがとう....私は常にHtoDの帯域幅がDtoHよりも小さいことを見ています。 – Sayan

CUDA：HtoDとDtoHの帯域幅の相違

答えて

関連する問題