私はすべてのタグをhtmlから削除し、URLをテキストとして表示するregexが必要です。例えばnode.jsタグを削除するregEx
このテキスト:
abc <a href="http://a.com" target="_blank">bbb</a> ccccccc
になるだろう:
abc bbb http://a.com ccccccc
私はすべてのタグをhtmlから削除し、URLをテキストとして表示するregexが必要です。例えばnode.jsタグを削除するregEx
このテキスト:
abc <a href="http://a.com" target="_blank">bbb</a> ccccccc
になるだろう:
abc bbb http://a.com ccccccc
text = html.replace(/href="([^"]*)"[^>]*>([^<]*)</g, '>$2 $1<').replace(/<[^>]*>/g, '');
最初replace
はリンクテキストの後にURLが追加されます。 2番目のreplace
はすべてのhtmlタグを削除します。
あなたは "HREF" の "A" のためのgetElementsByTagNameとgetAttributeを使用することができますまたはそれが正規表現に持っていますか?
RegExを持っています。私はnode.jsに書きます。私はdomを持っていません。 –
多分この記事[リンク](http://stackoverflow.com/questions/34268804/access-to-dom-using-node-js)が役に立ちます。 – csabinho
私もhttps://www.npmjs.com/package/jQueryを使うことができますが、私はregExや文字列の操作 –
DOMがあなたに信頼性を提供するときに、なぜこれを行うには(*不必要に、エッジケースで)正規表現を使用する必要がありますか?そしてなぜ 'href'(' 'http://a.com '')が 'bbb'と' cccccc'の間に来るのですか? –
私はdomを持っていないのでnode.jsで作業します。私はすべての日付をhtmlからno-html領域に表示するようにしています。 –