私はTensorflowのseq2seqモデル[1]を使用してチャットボットを実装しています。これにUbuntu Dialogue Corpusのデータを入力します。私はKalchbrenner et al [2]に記述されている標準LSTM細胞を用いたRNNとGrid LSTM細胞を比較したいと思います。BidirectionalGridLSTMの実装
私は、セクション4.4 [2]で説明されている変換モデルでGrid LSTMセルを実装しようとしていますが、私は双方向部分で苦労しています。
私はBidirectionalGridLSTMCellを使用しようとしましたが、num_frequency_blockの意味がわかりません。彼らはその論文で言及していない。誰でもnum_frequency_blockの意味を知っていますか? num_frequecy_blocks
:[必須] start_freqindex_list
とend_freqindex_list
で定義されている入力フィーチャー分割全体をカバーするために必要な周波数ブロックのリストです。
また、自分のセルを作成しようとしました。まず、入力を使ってフォワード処理を行い、入力を逆にして逆処理を行います。しかし、これらの結果を連結すると、形状が変化します。例えば。 ValueError:寸法は同じでなければならないが、64と32である 形状を変更せずに結果を連結するにはどうすればよいですか?それも可能ですか?
私は双方向グリッドLSTMを実装する方法について、他のヒントを持っていますか?
[1] https://www.tensorflow.org/tutorials/seq2seq/ [2] https://arxiv.org/abs/1507.01526
num_frequency_blocksを把握しましたか?私は同じ問題を抱えており、どこでもオンラインで明確な答えを見つけることはできません。 – Wmol
いいえ、申し訳ありませんが、わかりません。 – siljech