2017-11-24 15 views
1

私は簡単な深い学習モデルを作った。私は今、私の机上に唯一のCPUを持っています。 しかし、gpu設定でモデルのトレーニング時間を見積もる必要があります。 正確な正確なトレーニング時間の推定は必要ありません。 おおよその時間です。 これには方法や指標がありますか? GFLOPを比較するのが私の考えですが、計算しても意味がありません。CPUを使用してgpuの計算時間を見積もる方法はありますか?

ex。 cpu:intel e5-2686 v4、gpu:nvidia k80

+0

で簡単にはできません。 GPUは「より高速なCPU」ではなく、これらはアーキテクチャが異なり、特定の操作を20倍高速化し、他の操作は何もしません。メモリのコピーは実際には物事をさらに遅くすることができます。いくつかの経験則がありますが、それを行う「適切な」方法はありません。 – lejlot

答えて

1

データセットの並列度を近似することで、速度を見積もる非常に素朴なアプローチを使用できます(たとえば、それが不当に平行であれば、これは等しいかもしれませんあなたのデータセットの次元数)に、実際にデータを転送するゼロオーバーヘッドで並行処理の最良のケースの実装を想定し、数学は、簡単になる:通常

高速化= GPU上の物理的な作業項目の#( の典型的なnvidia実装のCUDAコアの数)を物理的な作業項目の数で割った数(CPUの物理コア数) 。

異なるハードウェアアーキテクチャ(ISR、デザインなど)とは関係のない相違点もあります。これらの計算は、モデルの見積もりに応じて実際の性能と大きく異なります並列性、並行性とハードウェアの実装。

関連する問題