MLの最初のステップ、具体的にはテキストセンチメント分析のための分類子を使用しています。私のアプローチは、通常の80%列車のデータセットと20%のテストを行うことです。訓練されたモデルを持ち、新しい機能が現れたときに生産環境で進める最善の方法は何ですか(最初のデータセットにはテキストの新しい単語はありません)。分類モデルの新機能の扱い
0
A
答えて
0
分類タスクでは、すべての機能を列車の時間に表示する必要があり、新しい機能を後で予測段階に追加することはできません。あなたの問題のために、ステミングまたはLemmatizingを使用することができます。それとも、この章では、有用である可能性
を訓練された文書の数が多いとLDAまたはWord2Vecような何か:あなたが記述しているhttps://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html
0
問題は、一般的に表示される「語彙のうち」(OOV)単語として知られていますテストセットがトレーニングセットに含まれていません。伝統的な手法は、各OOVワードを「UNKNOWN」などの特別なトークンで表現し、実際にはそのデータをトレーニングデータに含めることです。このアプローチは、JurafskyとMartinによる "Speech and Language Processing"のSection 4.3に詳しく説明されています。
最近のアプローチはWord2Vecを使用することです。これはニューラルネットワークで実際にはadvanced topicです。
関連する問題
- 1. jQueryの分類機能
- 2. 分類のためのテキストデータの扱い
- 3. PCA分類機能については、
- 4. 分類とクラスタリングの機能の関係
- 5. ケラス分類モデル
- 6. 異なる機能のアンサンブル分類器
- 7. オブジェクト分類の画像機能
- 8. Scalaの機能テストで扱うMIME処理エラーの種類
- 9. パフォーマンスSVMlightマルチラベル分類(機能:1000)
- 10. このDNNモデルを理解していて、なぜマルチラベル分類では機能しないのですか
- 11. マルチラベル分類のための不均衡なデータセットの扱い
- 12. mxnet train画像分類モデル
- 13. 新しい機能....ランダムに十分に機能しない
- 14. NNモデルのアーキテクチャピクセル単位の分類
- 15. Sparkの1つのクラス分類モデル
- 16. さまざまな種類の機能を持つDjangoモデル
- 17. 機械学習のないテキスト分類
- 18. テンソルフローの分類モデルを提供
- 19. R e1071 SVMモデルのtwitter分類
- 20. Kerasはマルチラベル分類をどのように扱いますか?
- 21. CNTK分類モデルすべて1を分類する
- 22. VN分類が機能していませんか?
- 23. さまざまな種類の機能を組み合わせる(テキスト分類)
- 24. 教師付き学習での抽出分類機能
- 25. JS:モジュールの種類に分割する機能
- 26. SVM分類の機能選択 - 奇妙な動作
- 27. kerasモデルのsklearnからの分類レポートの使い方は?
- 28. 機械学習 - 分類アルゴリズム
- 29. 機械学習分類アンサンブル
- 30. 機械学習分類データセット