私はテキスト分類ソリューションにワードベクタを使用しています。私は、訓練セットには存在しないが、実際のユースケースには存在する同義語の場合に主に対処するために、単語ベクトルを使用しています。単語ベクトルを使うだけでは、予測精度が十分に得られません。誰でも精度を向上させるために単語ベクトルに対して行うことができるいくつかの拡張を提案できますか?ワードベクタを使用したテキスト分類の拡張
-1
A
答えて
1
悪い予測ケースをデバッグします。シノニム(トレーニングデータセットに含まれているもの)の埋め込み品質は良いのでしょうか?
など、あなたのアプリケーションと同様の内容で、大きな語彙で訓練を受けている別の埋め込みを使用し
は(ラベル付きデータセット)を、よりトレーニングデータを取得します。これは多くの助けになるはずです。テキスト分類には、通常、非常に大きなスペースがあります。
テキスト分類子を訓練するときに、埋め込みレイヤーの「訓練可能」を許可します。あなたの埋め込み層のために事前に学習された埋め込みを取得するためのword2vecトレーニングと混同しないでください。大量のラベルなしデータを使用する可能性があります。ここでは、ラベル付きデータのみを含む比較的小さなデータセットを使用しています。埋め込み層を「訓練可能」とすることは、出力層から埋め込み層に勾配を逆伝播させて埋め込みベクトルを微調整することを意味する。
関連する問題
- 1. ケラを使用したRNNテキスト分類
- 2. TensorFlow - ニューラルネットワークを使用したテキスト分類
- 3. e1071(SVM)を使用したテキスト分類
- 4. nltk naivebayesテキスト分類用の分類器
- 5. Javascriptを使用したテキスト選択の拡張
- 6. jQueryを使用したリンクの拡張
- 7. NOテキスト分類のNaive Bayes分類
- 8. Bndtoolsを使用したJPA拡張
- 9. Restlet HTTPSを使用したOdata拡張
- 10. artoolkitを使用した拡張現実
- 11. Acumaticaを使用したCRAttributeList拡張
- 12. WhenInjectedInto拡張メソッドを使用したバインドバインド
- 13. テキスト分類に自分のデータを使ったTensorflowエラー
- 14. テキスト分類NaiveBayes
- 15. TensorFlowを使用したマルチラベルテキスト分類
- 16. LSA/SVDを使用したドキュメント分類
- 17. SVMを使用した分類
- 18. Tensorflowを使用したバイナリ分類
- 19. GMMとMATLABを使用した分類
- 20. サポートベクターマシンを使用したQues分類
- 21. TensorFlowデータセットを使用した分類
- 22. テキスト分類のパフォーマンス
- 23. テキスト分類でWEKAのMultilayerPerceptronを使用した出力が正しくない
- 24. クラシファイアアルゴリズムを使用して単一テキストを分類する方法
- 25. scikit-learn:カスタムラベルを使用してテキストを分類する
- 26. 拡張クラス内の拡張メソッド自体を使用して
- 27. フローを使用して反応成分を拡張する
- 28. 拡張機能付きのChrome拡張機能を使用したマウスクリック
- 29. Kerasを使用したテキスト分類:カスタム機能の追加方法
- 30. Weka + NaiveBayesによる分類分類子+テキスト分類
Welcome to StackOverflow。ヘルプドキュメントの投稿ガイドラインを読み、それに従ってください。 [on topic](http://stackoverflow.com/help/on-topic)および[How to Ask](http://stackoverflow.com/help/how-to-ask)をここで適用してください。私たちは特定の要求に対処することができますが、不明瞭な記述で対処することはできません。あなたのデザインと使い方を見せてください。あなたが得る正確さ、期待するもの、そしてあなたのアプローチで正確さが可能であると思われる理由を示します。 – Prune