連続した予測のための単純なn層のスタックされたRNN(LSTM、GRUなど)、最も効率的なデバイス配置戦略(複数のGPUが利用可能な場合)私は、RNNの各レイヤに1つのGPUを割り当てるのが好ましいと思うが、softmaxと損失計算はどうなるのだろうか? GPUやCPUに置かなければならないのでしょうか?さらに注意メカニズムを追加すると、CPUに注意を払う必要がありますか?RNNに最適なデバイス配置戦略?
答えて
これは研究の活発な分野です。一般的には、ネットワークの特性によって異なります。おそらく、あなたが同じGPUにソフトマックスとロスを置くことを望んでいるかもしれません。おそらく最上位層のGPU、またはgpu:0のいずれかになります。注目に値する、私は非常に明確な答えがあるとは思わない。注意重みのサイズなどの大きさによって異なります。これらの場合、私がsoftmax/lossについて提案した2つのプレースメントを試してみることをお勧めします。これにより、4つの可能な場所でグリッド検索が行われます。それらすべてを試してみてください:)
ありがとう! softmax/attentionのためにさまざまなデバイスの配置を試みる前に、1つのGPUと4つのGPUを使用して多層RNNを使用することの違いを比較しようとしました。私が試したモデルは、1dコンボリューション+ドロップアウト+ 4 GRU +ソフトマックスのアーキテクチャを持ち、これらのレイヤに4 GPUを配備しようとしました。しかし、4つのGPUを使用するのは実際には1 GPU(1 GPUのタイムライン:[link](https://drive.google.com/open?id=0Bycn-mCLj2bvWGxsbnRva3hWN2M)、4 GPUのタイムライン[リンクライン(https://drive.google.com/open?id=0Bycn-mCLj2bvZXExYlhnRE5ZRm8)) – thinkbear
タイムラインプロファイルから判断すると、4-GPUバージョンでは、1つのGPUで1つのレイヤーRNNを計算すると、 1-GPUバージョンよりも長い時間です。改善できる明確なことはありますか? – thinkbear
- 1. hibernate stalestateExceptionの最適な更新戦略
- 2. Tensorflowのデバイス配置のデフォルト戦略は何ですか?
- 3. Webアプリケーション開発の最適化戦略
- 4. AWSS3ビデオアップロードのバケット位置の最適な戦略は何ですか?
- 5. vimのコードチャンクとマクロの最適な戦略は何ですか?
- 6. GAE CloudSQLの最適な移行戦略は何ですか
- 7. ディレクトリに戦略を適用する
- 8. デフォルト戦略の戦略パターン
- 9. 遺伝Algortihm - 可変長最適化の戦略
- 10. created_at列とupdated_at列のどちらに最適な戦略ですか?
- 11. 従来のアプリケーション移行戦略 - 戦略に必要なアドバイス
- 12. リンクされたユーザーをグループ化する最適な戦略は何ですか
- 13. 戦略
- 14. iOSビルドパッケージが非常に大きく、最適化戦略があります
- 15. 配列の戦略比較を返す
- 16. シンプルなコードパーサーのデザイン戦略
- 17. 安全なトライアル戦略
- 18. Railsフラグメントキャッシュ戦略
- 19. JIRAコンポーネント戦略
- 20. バックアップ戦略
- 21. Openlayers bbox戦略
- 22. ソフトウェアデザイン戦略
- 23. solrインデックス戦略
- 24. プロジェクト/コードリリース戦略
- 25. 集約戦略
- 26. Golangログ戦略
- 27. UMLデータフローダイアグラム戦略
- 28. ELBルーティング戦略
- 29. データベースプルーニングの戦略
- 30. OAuth2ベアラトークンリフレッシュ戦略
どのような組み合わせをプロファイリングしましたか? – user2717954