私はウェブサイト上の肯定的なレビューの数を数えようとしています。次の文字列を考えてみましょう。アンダースコアで次の単語に文の否定をリンクします
これらは逆の意味です。自動分類では、$ str_2と$ 3はほとんどの分類器(文中の陽性語の数を単に数えます)によって陽性として数えられます。私は、文字列をトークン化することによって開始
$str_1 = "This is great";
$str_2 = "This is not_great after all";
$str_3 = "That isn't_good and I will not_return to this store.";
:私は次のように、 『戻る』と「良い」ではないと「ない」、「素晴らしい」と「ない」リンクすることによって、このエラーを回避したい
$tokens = explode("", $str_3);
しかし、私はどのように進むべきかわかりません。どのように私は後の単語に否定的な単語( "not"、 "not")をリンクしますか?正規表現はここではうまく使用できませんか?
私は機械学習のケースである可能性が高いと思います。 – onatm
正規表現はあなたが達成しようとしているものの1つの要素かもしれませんが、指摘されているように、十分ではない可能性があります。 – Peter
例文として、私はこれを追加したい:これは結局悪くない。あなたは負の構造化された積極的な文章を考慮に入れるべきです。 – onatm