私はDNNをトレーニングするための最適精度を研究しています。 私は推論のために、圧縮された8ビットの精度さえも機能するはずであることを知りました。トレーニングのためには、より高い精度の数値が必要です。 ディープラーニング(fp16、fp32、またはfp64)の最適精度はどのようになりますか? 私はこの目的のためにtensorflow-gpuを使用するかもしれません。典型的なディープニューラルネットワークをトレーニングするための最適精度はどれくらいですか?
0
A
答えて
0
これは、最適化のための評価関数によって異なります。フォーカストレーニングの時間精度(精度の低下が少ない)、精度(精度の精度が劣る場合があります)、その他のリソースですか?これは、モデルの複雑さとトポロジにも多少依存します。
ConvNet(MNIST)は8ビット浮動小数点数で問題ありません。訓練はより速く、正確さの差(もしあれば)は重要ではない。より相互依存性があり、脆弱なもの(おそらくカーネルが枯渇したGNN)に移行すると、8ビットに落とす際の精度が低下することに気付くでしょう。
また、必要に応じて、8ビット浮動小数点数に落とすことでトレーニング時間を節約できますが、モデルを広げ(畳み込みレイヤーのカーネルを増やす)、わずかな誤差を回復します。
2
ほとんどの場合、最適精度はfloat32です。 float64はgpuでの実行を大幅に遅くします。一方、tesla p100 GPUを使用していない限り、float16を使用しても実行速度は向上しません。
関連する問題
- 1. Javaのメモリ割り当ての典型的な速度はどれくらいですか?
- 2. この典型的なケースでの予測に最適なアプローチ
- 3. C++プロファイリング/最適化:最適化された関数で精度の高いプロファイリング精度を得る方法
- 4. .NETのTimerの最大精度はどれくらいですか?
- 5. iPhone 4のGPSの精度はどれくらいですか?
- 6. xeon fpuの精度はどれくらいですか?
- 7. PHPの日付精度はどれくらいですか?
- 8. 精度はWEKA WrapperSubsetEvalで最適化されていますか?
- 9. トレーニングの精度以上のテスト精度
- 10. Tensorflowを使用したディープニューラルネットワークの精度が低い
- 11. 異なるOSでPHPのマイクロ秒精度はどれくらいですか?
- 12. データ型の順序は、Pythonで最大から最小の精度ですか?
- 13. "典型的な" Salesforceのインストール/設定コードの基盤はどれくらいの大きさですか?
- 14. UITableViewsの最適なセルサイズはどれくらいですか?
- 15. Geofireの距離の精度はどのくらいですか?
- 16. (check_load)のような典型的なあらかじめ構築されたNagiosプラグインのソースコードは何ですか?
- 17. scheduleAtFixedRateの精度はどのくらいですか?
- 18. CLLocation精度はどのくらい正確ですか?
- 19. カメラがコインを認識するための適切な角度はどれくらいですか?
- 20. 最適な実行タスク数はどれくらいですか?
- 21. NNバッチとトレーニングの精度
- 22. 機械学習で高い精度を得るデータセットの最小サイズはどれくらいですか?
- 23. 妥当性検査の精度はトレーニングの精度と同じくらい高くすることは可能ですか?
- 24. 最適なニューロンと精度と効率
- 25. Kerasでトレーニング精度の出力を取得するにはどうすればよいですか?
- 26. 学習曲線 - トレーニングの精度がなぜ高まり始めたのはなぜですか?
- 27. 典型的なLinuxディストリビューションの中で最も古いコード
- 28. Node.jsとブラウザのsetTimeout/setIntervalの精度はどれくらいですか?
- 29. クラスファイルの最適サイズはどれくらいですか?
- 30. Androidアプリの最適サイズはどれくらいですか?
私がほとんど見たことは、すべての操作がfloat64で実装されているかどうかわからないfloat32です。 –
この問題は、たとえばhttps://github.com/tensorflow/tensorflow/issues/13097 –