タグ名に基づいてhtmlタグ(タグ全体)と一致させる必要があります。私はこれを持っているスクリプトタグの場合正規表現で特定のhtmlタグを一致させる
:
<script.+src=.+(\.js|\.axd).+(</script>|>)
それは正しく、次のHTMLで両方のタグに一致します。しかし
<script src="Scripts/JScript1.js" type="text/javascript" />
<script type="text/javascript" src="Scripts/JScript2.js" />
、私は次のようにリンクタグを行うとき:
<link.+href=.+(\.css).+(</link>|>)
これはすべてを一度に一致させます(例えば、両方のアイテムを含む1つの試合を返します):
<link href="Stylesheets/StyleSheet1.css" rel="Stylesheet" type="text/css" />
<link href="Stylesheets/StyleSheet2.css" rel="Stylesheet" type="text/css" />
私はここで何が欠けていますか?正規表現は、一致するテキスト以外は本質的に同じですか?
また、正規表現はHTML解析のための優れたツールではないことを知っています...私はおそらく最後にHtmlAgilityPackを使用することになりますが、これはナッツを駆動しています。健康!
これがあなたを運転しているのであれば、まだHTMLアジリティパックを使用していないのはなぜですか? – BoltClock
私はそれを今すぐダウンロードしています...私はちょうどそれらが一致しない理由を理解できません! –
あなたのREは '.'の過度使用のためあいまいです。Pythonでは、両方のREが入力全体と一致します。 –