私はPythonとNLTkを使い慣れていません。私は、NLTK(NaivesBayesCalssifier)での調査の感情分析のために作成されたモデルを持っています。精度を向上させるために、モデルに正と負のステートメントのリストを含む辞書を追加したかったのです。 NLTKにモジュールがありますか?モデルを改善できる追加機能がありますか?NLTKでのセンチメント分析の辞書
0
A
答えて
1
あなたは正と負の言葉のコーパスを提供する公的な感想の辞書を見ることができます。
そのうちの一つは、あなたがあなたの現在のモデルについての詳細を指定していない、ので、私はあなたが非常に基本的な単純ベイズ分類器を使用していると仮定していhttps://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html
で見つけることができます。ユニグラム(単語)を使用してテキストをベクトル化する場合、特徴ベクトルを生成するためにバイグラムやトリグラムを使用することを検討できます。これは基本的に、単語の文脈情報をある程度まで使用できるようにします。
テキストを変換するためにTfidfなどの単語モデルのバッグを使用している場合は、その代わりに単語埋め込みを使用することを検討できます。単語の袋は単語の文脈情報を考慮しないが、単語埋め込みはそれを利用することができる。
単語をベクトルに変換するディープ学習を使用するgensimのようなものを使用できます。次をご覧ください:https://radimrehurek.com/gensim/models/word2vec.html
さらに、linearSVCクラシファイアまたはロジスティック回帰クラシファイアを使用して、常に最高の精度を与えるものを選択することができます。
関連する問題
- 1. んNLTKは、センチメント分析
- 2. センチメント分析のセグメンテーションパターン
- 3. センチメント分析
- 4. NLTKセンチメント分析でネガティブな回答しか得られない分類器
- 5. rapidminerとセンチメント分析
- 6. アスペクトベースのセンチメント分析ライブラリ
- 7. CoreNLPセンチメント分析をスピードアップ
- 8. 日記エントリのセンチメント分析のデータセット
- 9. NLTKによるセンチメント分類ナイーブベイズ分類器
- 10. Seq2seqセンチメント分析を実装するTensorFlow
- 11. スタンフォードコアNLPセンチメント分析:自分のデータを使ったトレーニング
- 12. C++センチメント解析ライブラリ
- 13. qdapを使用したレビューコメントのセンチメント分析が遅い
- 14. tflearn(lstm -Tensorflow)を使用したIMDBデータのセンチメント分析
- 15. swift - JSON辞書の解析
- 16. スウィフトの解析辞書3.0
- 17. 辞書ベースの感情分析の精度
- 18. センチメント分析のための最善の前処理テクニックは何ですか?
- 19. Twitterのセンチメント解析エラーコード:KeyError: 'text'
- 20. 解析辞書と私はこのような辞書持っ
- 21. アスペクトベースのセンチメント分析の深刻な学習モデルを実装する際のエラー
- 22. センチメント分析、私はGoogleのクラウドライブラリを通じて感情分析を実施しています
- 23. 辞書の差分[キー] =値
- 24. 辞書の部分一致
- 25. 仕分け辞書
- 26. 感情分析を予測する際のエラーTensorflow NLTK
- 27. 分かりませんNLTK正規表現の解析形式
- 28. apache mahoutを使ったセンチメント解析
- 29. スタンフォードCoreNLPを使用したセンチメント解析
- 30. 解析スウィフト辞書の二次レベル
(1)http://www.nltk.org/py-modindex.htmlを参照して、NLTKにあるモジュールを確認してください。 (2)助けになる追加の機能があるかもしれませんが、あなたが現在使っているものを指定していないので、伝えるのは難しいです。とにかく、フィーチャエンジニアリングはプログラミングに関する質問ではなく、研究トピックの多く(それはSOに属しません)です。 – lenz
これまでのセンチメント分析モデルは何を使用していますか? – alexis