2016-11-16 4 views
1

私は画像キャプションに関するプロジェクトを行っています。私は、ラサグーン(theano)のLSTMLayerの最初の隠れた状態として、shape =(batch_size、512)を持つイメージのバッチを設定したいと思います。 LSTMLayerへのシーケンス入力は、shape =(batch_size、max_sequence_length、512)のテキストシーケンスのバッチです。私は、lasagneのLSTMLayerにhid_initパラメータがあることに気付きました。誰もラサグーンのLSTMLayerのためにそれを使用する方法を知っていますか?自分でカスタムLSTMLayerを実装する必要はありますか?LagnayerはLSTMLayerの最初の非表示状態として画像入力を使用します

答えて

1

あなたは(このenter link description hereを見ると、C0にH0からの接続を書き留め)H_0はC0を使用しているため、H_0パラメータを設定する必要がいけないので、あなただけのC0パラメータを設定する必要があります。

decoder = LSTMLayer(l_word_embeddings, 
       num_units=LSTM_UNITS, 
       cell_init=your_image_features_layer_512_shape, #this is c0 
       mask_input=l_mask) 

あなたが設定することができますc0をレイヤーとして、または他の配列として使用することができます(lasagne LSTM doc enter link description hereを参照)。

さらに詳しくお答えします。

関連する問題