自然言語処理でデータの精度を%で求めるにはどうすればよいですか?apacheを使用した自然言語処理OpenNLP
プロセスは、サイズの映画のレビューファイルを使用したトレーニング目的のために
以下のように続いて、新鮮な映画のレビューは、レビューがポジティブであるかどうかを判断するために、来たら映画レビューデータ
の精度を見つけよう200 MBのレビューコメントとそれに対応する評価を有する400 MB。ファイル内の評価に基づいて
は言葉のバッグを実装などのため に近づく:言葉の袋を実装しながら評価> 5は、その後、他の良いバッグ悪い袋
にそれを置く場合NLP技術の下に使用されるアプローチ
- トークン化
- ストップワード除去
バッグは、新鮮な口コミを、準備ができたら、次に前述したように、新鮮なレビューがポジティブであるかどうかを決定することに基づいて、いずれか大きい方善と悪の袋に意味計算の袋に見上げるNLPの技術を使用して、コメント。
精度を%で把握する方法をお勧めしますか?