以下の手順(広範に)に従って、Kerasライブラリを使用して感情分類子モデルを訓練しました。トークナイザオブジェクト/クラスを使用してシーケンスにKeras Text Preprocessing - スコアリングのためにTokenizerオブジェクトをファイルに保存する
- 変換テキストコーパス
- は、私は、このモデルを使用してスコアリングのために今、このモデルに
を評価model.fit()メソッドを使用してモデルを構築しますモデルをファイルに保存してファイルから読み込むことができました。しかし、私はTokenizerオブジェクトをファイルに保存する方法を見つけていません。これがなければ、私は1つの文章でもスコアを取る必要があるたびにコーパスを処理する必要があります。これを回避する方法はありますか?
テストセットでtokenizer.fit_on_textsを再度呼び出しますか? – cgl
番号fit *をもう一度呼び出すと、インデックスが変更される可能性があります。ピックルがロードされたトークナイザはすぐに使用できます。 –