0

ディープ学習の文献では、スタック型RNN(スタック型LSTM)ネットワークを使用した例が多数ありました。セル自体の詳細を調査していますが、スタック型アーキテクチャでは、か否か。スタックされたlstmまたはスタックされたRNNでは、デフォルトでレイヤ間でウェイトを共有する必要がありますか?

私が理解しようとしているのは、作者がこれを指定していない場合、デフォルトの動作は何でしょうか?レイヤー間でウェイトを共有していると仮定する必要がありますか?または各レイヤーにはセルの独自のウェイトセットがありますか?

答えて

0

各レイヤーに独自の重みのセットがあると仮定します。 4ページの式(1)および(2)を参照してください。here。ご覧のように、重みはレイヤーに依存します(vanilla rnnを扱う方程式ですが、LSTMでも同じことが仮定されています)。

関連する問題