私は、python nltkモジュールとnaivebayesクラシファイアを使ってテキストのスニペットを分類するプロジェクトに取り組んでいます。私はコーパスのデータを訓練し、別のデータセットを分類することができますが、最初の訓練の後に分類子に追加の訓練情報を送りたいと思います。nltkクラシファイアを徐々に訓練する方法
私が誤解していない場合、NaiveBayesClassifier.trainメソッドがトレーニングデータの完全なセットを取るという点で、これを行う方法がないようです。元のフィーチャセットを使用せずにトレーニングデータに追加する方法はありますか?
私は、時間の経過とともに新しいトレーニングデータを受け入れることができる他の分類子を含む提案には公開しています。
1)定期的に新しいデータの分類器を再訓練:
最後にこの問題の解決策を見つけましたか? – w2lame
私は再分類せずに新しいトレーニングデータを提供するために、クラシファイアの内部をちょっとハッキングしました。それはずっと前のことだったので、私は正確に思い出すことはできませんが、実現可能であったと思います。それ以降は私はプロジェクトで遠くまでは行かなかったので、現役ではありません。 – Rog
ありがとう、返信ありがとう@rog :) – w2lame