私は人間の言語とHTMLが混在した文字列変数を持っています。 "<"と ">"に埋め込まれているすべてのHTML部分を削除したいと思います。"<" ">"とその間のすべてをエスケープする方法は?
gsub("\\<[^\\<]*\\>", "", subject, perl=TRUE);
しかし、私は、\ <が有効なエスケープではないことを言われた:私は、次のことを試してみました。誰かが私にこの問題を助けることができますか?どうもありがとう!
私は人間の言語とHTMLが混在した文字列変数を持っています。 "<"と ">"に埋め込まれているすべてのHTML部分を削除したいと思います。"<" ">"とその間のすべてをエスケープする方法は?
gsub("\\<[^\\<]*\\>", "", subject, perl=TRUE);
しかし、私は、\ <が有効なエスケープではないことを言われた:私は、次のことを試してみました。誰かが私にこの問題を助けることができますか?どうもありがとう!
gsub
は、<tags>
の代わりに<tags>
の間の出力内容を置き換えることができます。
> str
[1] "<font size=6>Done with payin good ol Sallie Mae for my learnin at the institushin.</font>"
> gsub("<.*?>","", str)
[1] "Done with payin good ol Sallie Mae for my learnin at the institushin."
ありがとう!私はちょっと愚かな質問を見つけました。 "<" and ">"はエスケープする必要はありません。 – xinyuanliu
実際のトリックは、エスケープ文字だけでなく、疑問符です... –
は「はinstitushinで私learninため古き良きサリーメイをpayinで完了。」これは、1つの観測がどのように見えるかです。どうすればいいのでしょうか?「私の勉強のために、良いお金を使って、サリーメイと一緒に行ってください」。 – xinyuanliu
このコメントは何ですか? – Masoud
質問を編集して、[再生可能な例](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)に入力と希望の出力を含めてください。 – MrFlick