2016-04-07 4 views
-4

私は何時間も試してきました。
<a href></a>の間にあるウェブページソースのすべてのテキストは、<a>タグの間にネストされている以外は、リンク可能なテキストの意味を取得する必要があります。
例:あなたは非貪欲グループとの単純な正規表現を使用でき正規表現でリンク可能なテキストを取得する

<a href="blabla.net">THIS TEXT 
<img src="hhh.jpg" />   THIS TEXT TOO 
       <span> ALSO THIS TEXT. </span>AND ALSO THIS TEXT</a> 
+0

あなたはまだ何を試しましたか? – Cylian

+1

あなたはどの言語を使用していますか? –

答えて

0

<[aA]\b[^\>]*>([\w\W]*?)<\/[aA]> 

をあなたは

$(document.body).html().match(/<a\b[^\>]*>([\w\W]*?)<\/a>/ig) 
+0

リンク内にタグがある場合は一致しません –

+0

@PoulBakテストしましたか?このページでそれをやってみてください。それはうまくいくでしょう。 –

+0

複数の行がない場合はありません。さらに、彼はimgとspanタグが返されるのを望んでおらず、テキストだけを返します。 –

0

を入力して、次にF12を押すことで、このページにそれをテストすることができます次の4つのグループのタグ間のテキストを返す正規表現を試すことができます:

(?<=>)[^<]+?(?=<) 

テキストからタグを削除します。

関連する問題