2017-08-29 6 views
1

私は人間の言語とHTMLが混在した文字列変数を持っています。 "<"と ">"に埋め込まれているすべてのHTML部分を削除したいと思います。"<" ">"とその間のすべてをエスケープする方法は?

gsub("\\<[^\\<]*\\>", "", subject, perl=TRUE); 

しかし、私は、\ <が有効なエスケープではないことを言われた:私は、次のことを試してみました。誰かが私にこの問題を助けることができますか?どうもありがとう!

+0

は「はinstitushinで私learninため古き良きサリーメイをpayinで完了。」これは、1つの観測がどのように見えるかです。どうすればいいのでしょうか?「私の勉強のために、良いお金を使って、サリーメイと一緒に行ってください」。 – xinyuanliu

+0

このコメントは何ですか? – Masoud

+1

質問を編集して、[再生可能な例](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)に入力と希望の出力を含めてください。 – MrFlick

答えて

2

gsubは、<tags>の代わりに<tags>の間の出力内容を置き換えることができます。

> str 
[1] "<font size=6>Done with payin good ol Sallie Mae for my learnin at the institushin.</font>" 

> gsub("<.*?>","", str) 
[1] "Done with payin good ol Sallie Mae for my learnin at the institushin." 
+0

ありがとう!私はちょっと愚かな質問を見つけました。 "<" and ">"はエスケープする必要はありません。 – xinyuanliu

+1

実際のトリックは、エスケープ文字だけでなく、疑問符です... –

関連する問題