複数のGPUを使用する通常の方法は、データセットを分割して各GPUに割り当てることです。テンソルフローでデータセットを分割する代わりに、一度に1つのデータセットに複数のGPUを使用する
しかし、分割されていないデータセット全体の高速計算に複数のGPUを使用する方法はありますか?私は、GPUがトレーニングネットワークに使用されるとき、マトリックス乗算が単一のGPU内で並列化されることを意味します。一度に複数のGPUを使用することで、この行列の乗算を高速化できますか?
たとえば、データセットには1つの画像しかありません。複数のGPUに分割して配布するための複数の画像がないので、この1枚の画像の計算にすべてのGPUを使用したいと考えています。
Tensorflowで可能ですか?私はインターネットで検索しましたが、非常にまれであるため何も見つかりませんでした。