2016-08-07 11 views
0

私はすべてのタグをhtmlから削除し、URLをテキストとして表示するregexが必要です。例えばnode.jsタグを削除するregEx

このテキスト:

abc <a href="http://a.com" target="_blank">bbb</a> ccccccc 

になるだろう:

abc bbb http://a.com ccccccc 
+0

DOMがあなたに信頼性を提供するときに、なぜこれを行うには(*不必要に、エッジケースで)正規表現を使用する必要がありますか?そしてなぜ 'href'(' 'http://a.com '')が 'bbb'と' cccccc'の間に来るのですか? –

+0

私はdomを持っていないのでnode.jsで作業します。私はすべての日付をhtmlからno-html領域に表示するようにしています。 –

答えて

0
text = html.replace(/href="([^"]*)"[^>]*>([^<]*)</g, '>$2 $1<').replace(/<[^>]*>/g, ''); 

最初replaceはリンクテキストの後にURLが追加されます。 2番目のreplaceはすべてのhtmlタグを削除します。

1

あなたは "HREF" の "A" のためのgetElementsByTagNamegetAttributeを使用することができますまたはそれが正規表現に持っていますか?

+0

RegExを持っています。私はnode.jsに書きます。私はdomを持っていません。 –

+0

多分この記事[リンク](http://stackoverflow.com/questions/34268804/access-to-dom-using-node-js)が役に立ちます。 – csabinho

+0

私もhttps://www.npmjs.com/package/jQueryを使うことができますが、私はregExや文字列の操作 –

関連する問題