0

GPUモードでgoogle cloud mlを使用しようとしています。グーグルクラウドでGPUを実行中のエラーシンボルログ

私はBASIC_GPUモードを訓練するとき、私は多くのエラーログを持っています。
しかし、それはよく練習します。
学習がGPUモードで正常に機能しているかどうかはわかりません。

これはエラーログの履歴です。
enter image description here

これは、印刷config.log_device_placementの一部です。
enter image description here

また、complex_model_m_gpuモードを試してみました。 BASIC_GPUのようなエラーログもあります。
しかし、config.log_device_placementを印刷すると、gpu:/ 1、gpu:/ 2、gpu:/ 3が表示されません。 gpu:/ 0だけ見ることができます。

重要なことは、BASIC_GPUとcomplex_model_m_gpuの実行時間が同じであることです。

学習がGPUモードで正常に動作しているのか、何か問題があるのだろうかと思います。

申し訳ありませんが私の英語のために、誰もが問題を知っています。
ありがとうございます。

答えて

0

GPUを最大限に活用するためのヒントについては、TensorFlowのperformance guide for optimizing for GPUsを参照してください。

あなたはどのデバイスに割り当てられますどのOPS見るために、デバイスの配置のログ記録をオンにすることができ

  • を注意するカップルの事。これは、opsが実際にGPUに割り当てられていること、複数のGPUを使用している場合にすべてのGPUを使用していることを確認するのに最適です。
  • TensorBoardはデバイスの配置に関する情報も提供する必要があります。これは、すべてのGPUを使用しているかどうかを確認する別の方法です。
  • 複数のGPUを使用する場合は、すべてのGPUにopsを割り当てていることを確認する必要があります。 TensorFlow guideには、このトピックの詳細が記載されています。
関連する問題