1
文境界を越えない繰り返し言語モデル(例:LSTM)を構築する最良の方法は何ですか?もっと一般的に言えば、複数の文を含む各行に、モデルにバッチを提示すると、各文を見た後で状態をどのようにリセットできますか?モデルに指定できる特別なトークンはありますか?バッチ=文章レベルの言語モデルのTensorFlowリセット状態
ありがとうございます!
文境界を越えない繰り返し言語モデル(例:LSTM)を構築する最良の方法は何ですか?もっと一般的に言えば、複数の文を含む各行に、モデルにバッチを提示すると、各文を見た後で状態をどのようにリセットできますか?モデルに指定できる特別なトークンはありますか?バッチ=文章レベルの言語モデルのTensorFlowリセット状態
ありがとうございます!
文が独立している場合は、バッチ内の各行に1つの文しか含まれないようにするとより洗練されたものになります。次に、this questionの回答で説明したように、各バッチ後にLSTMの状態をリセットすることができます。