私はいくつかの答えを見てきましたが、私は常に自分の問題の一部にしか答えません。私はネガティブワードのベクトルと顧客のレビューを持つデータフレーム列を持っています。最終的な目標は、それぞれのレビューに感情を割り当てることです。例えば、レビュー"I was happy with the product"
は、すべての単語について中立的な感情を有するが、この場合には正の意味を有する"happy"
である。今私は否定を処理する必要があります。ほとんどの場合、彼らは感情を振り向いて、前からの評価は否定的な感情で"I was not happy with the product"
になるでしょう。明らかに、これよりも複雑になる可能性があります。R部分文字列をそれ自身と次の単語に置き換えます(否定処理)
私はネガティブワードnegations
のベクトルとreviews
のベクトル(データフレームカラム)を持っていると仮定して、すべてのネゲートワードを否定、アンダースコア、最終的には"I was not_happy with the product"
になります。これは、否定された単語を1つのものとして扱うことを可能にします(もちろん、それに応じて私の感情の単語コーパスを調整する必要があります。実際の言語は英語ではありません。正規表現のプロではありませんmは
例
negations <- c("not", "without", "never")
reviews <- c("I was happy", "I never asked", "I came without hope", "He did not help")
結果が
c("I was happy", "I never_asked", "I came without_hope", "He did not_help")
予想よりもはるかに簡単です。 tks。 – Triamus