0
pytorch RNN implementationには、2つのバイアス、b_ih
およびb_hh
があります。 これはなぜですか? 1つのバイアスを使用するのと違うのですか?はいの場合、どうですか?パフォーマンスや効率に影響を与えますか?RNNに2つのバイアスベクトルが必要なのはなぜですか?
pytorch RNN implementationには、2つのバイアス、b_ih
およびb_hh
があります。 これはなぜですか? 1つのバイアスを使用するのと違うのですか?はいの場合、どうですか?パフォーマンスや効率に影響を与えますか?RNNに2つのバイアスベクトルが必要なのはなぜですか?
RNNのPytorch Documentの表記は自己説明です。式中のb_ih
とb_hh
です。
あなたはb_ih
入力バイアス(w_ih
と対、入力の重み)であると考えることができ、b_hh
は、隠された(w_hh
と対、隠されたため重量)のバイアスである