POSタグ付きフレーズthe_DT flower_NN pot_NN
があり、すべての名詞シーケンスをアンダースコアで区切られた単一の名詞に結合したいと考えています。the_DT flower_pot_NN
ruby regex:POSタグ付きデータの名詞クラスターを置換する
私は次のことをしようとしている:
s.gsub!(/ ([^ ]+)_NN ([^ ]+)_NN/, " #{$1}_#{$2}_NN")
のような行に複数の名詞がある場合は、この解決策は失敗します。the_DT monster_truck_wallpaper_NN
なるはずthe_DT monster_NN truck_NN wallpaper_NN
は、。
どうすればよいですか?
あなたの例の出力を 'the_DT monster_truck_wallpaper_NN'にしますか? – climbage
はい: 'the_DT monster_NN truck_NN wallpaper_NN'は次のようになります:' the_DT monster_truck_wallpaper_NN' – dsg