グーグルクラウドでの大規模なニューラルネットワークモデル(テンソルフロー)のトレーニングと評価。私はそれがコンテナのメモリ制限に関係していると思います大規模なテンソル、ドッカーの制限を処理するメモリのGoogleクラウド?
W Resource exhausted: OOM when allocating tensor with shape[38633472,17]
W Ran out of memory trying to allocate 2.45GiB. See logs for memory state.
undefined
:私のモデルを評価する際に
は、次のエラーを得ました。これに関する助力はありますか?
詳細をお知らせください。使用しているコンテナ、実行しようとしているモデルなど – Priyatham
Google Cloudが使用しているコンテナがわかりません。私は単に「ml-engine jobs submit training」コマンドを実行します。私はかなり大きなロジスティックモデルを使用します。 – guyov