R部分文字列をそれ自身と次の単語に置き換えます（否定処理）

私はいくつかの答えを見てきましたが、私は常に自分の問題の一部にしか答えません。私はネガティブワードのベクトルと顧客のレビューを持つデータフレーム列を持っています。最終的な目標は、それぞれのレビューに感情を割り当てることです。例えば、レビュー"I was happy with the product"は、すべての単語について中立的な感情を有するが、この場合には正の意味を有する"happy"である。今私は否定を処理する必要があります。ほとんどの場合、彼らは感情を振り向いて、前からの評価は否定的な感情で"I was not happy with the product"になるでしょう。明らかに、これよりも複雑になる可能性があります。R部分文字列をそれ自身と次の単語に置き換えます（否定処理）

私はネガティブワードnegationsのベクトルとreviewsのベクトル（データフレームカラム）を持っていると仮定して、すべてのネゲートワードを否定、アンダースコア、最終的には"I was not_happy with the product"になります。これは、否定された単語を1つのものとして扱うことを可能にします（もちろん、それに応じて私の感情の単語コーパスを調整する必要があります。実際の言語は英語ではありません。正規表現のプロではありませんmは

例

negations <- c("not", "without", "never") 
reviews <- c("I was happy", "I never asked", "I came without hope", "He did not help")

結果が

c("I was happy", "I never_asked", "I came without_hope", "He did not_help")

出典

2017-12-12 Triamus

する必要がありますあなたがstringiパッケージからこれを試すことができます。

stringi::stri_replace_all_fixed(reviews, 
    paste0(negations, " "), 
    paste0(negations, "_"), vectorize_all = F)

出典

2017-12-12 09:03:44 minem

予想よりもはるかに簡単です。 tks。 – Triamus

R部分文字列をそれ自身と次の単語に置き換えます（否定処理）

答えて

関連する問題