Nvidiaウェブサイトでは、MXNetはNCCL(https://developer.nvidia.com/nccl)を使用していると主張しています。しかし、MXNetのgithubリポジトリから実際にNCCLライブラリを使用している参照は見つかりませんでした。チェイナのブログでMXNetはマルチGPU通信にNvidiaのNCCLライブラリを使用しましたか?
、彼らはまた、チェイナが原因チェイナでNCCLライブラリーの使用の4つのGPU上でMXNetよりも優れた性能を達成したと主張した。(https://chainer.org/general/2017/02/08/Performance-of-Distributed-Deep-Learning-Using-ChainerMN.html)
MXNetリポジトリ内の古いポストのいくつかでは、I彼らはMXNetにNCCLライブラリを含めることの難しさについて話していたことが分かります。
私の最初の質問は、NCCLライブラリを持つMXNetのバージョンはありますか? 第2に、NCCLライブラリを使用した場合のパフォーマンスの影響(つまり、メモリ使用量が少なく、複数のGPUでの通信オーバーヘッドの低減)はどうですか?
NCCLの訂正、現在のPRはこちら:https://github.com/apache/incubator-mxnet/pull/8294 –