さらに別の帯域幅関連の質問。私はDevice-to-Host帯域幅のプロットとHost-to-Deviceの帯域幅のプロットが似ていると予想しましたが、両者の間には大きな違いがあることがわかりました。同じルートに従うことを考慮すると、有効帯域幅は同じでなければなりません。テストベッドは、2つのソケットに合計12個のIntel Westmere CPU、4個のPCIe Gen2 Expressスロットを備えた4個のTesla C2050 GPUで構成されています。 NVidiaコードサンプルのbandwidthtestプログラムを使用します。 CUDA:HtoDとDtoHの帯域幅の相違
ホストからデバイスへのcudamemCpyのオーバーヘッドはどのくらいですか?
興味深い質問です。私はM2050の場合と同様の結果を得て、S1070の場合は逆の結果を得ているようです。結果は非常によく似ています - あなたのものと同じですが、私も矛盾がどこに来るのか疑問に思っています。 – Patrick87