0
私は構造化されていないテキストを持っています。私はテキストマイニングタスクのコンセプトを維持するためにいくつかの単語を組み合わせたいと思います。例では、以下の文字列で、 "High_pressure"に "High pressure"を、 "Not_working"に "not_working"を、 "No_air"に "No air"を変更したいと考えています。言葉正規表現を使って単語を結合するR
c('low', 'high', 'no', 'not')
所望の出力の
サンプルテキスト
c(" High pressure was the main problem in the machine","the system is not working right now","No air in the system")
一覧
# [1] " High_pressure was the main problem in the machine"
# [2] "the system is not_working right now"
# [3] "No_air in the system"
"遅い" あなたはすべての接頭辞(ハイ、いや、ないなど)との完全なリストを持っているのですか? –
(low、high、no、not) –
単語を組み合わせる代わりにバイグラムとトライグラムを使用する必要があります。 – vagabond