2009-05-06 17 views
0

一部のHTMLソースを解析しています。 HTML文書のaltタグが空であるかどうかを調べる正規表現スクリプトはありますか?正規表現でaltタグを取得する

altタグが空であるかどうかを確認します。

正規表現はこれに適していますか、C#で文字列操作を使用する必要がありますか?

+0

最近、私は恐ろしいregexhtml質問の不足はありますか? – annakata

+0

@annakata:頻度の上昇があり、それも私の気持ちです。一方、一般的にはCSS/HTMLの質問が増加しています。 – Tomalak

答えて

2

HTMLタグとチェックタグを解析し、次のリンクを使用する必要があります.HTMLタグを解析するためのC#ライブラリが含まれています。タグをループしてタグ数を得ることができます。Parsing HTML tags

0

これが有効なXHTMLの場合、なぜRegexが必要なのですか?あなたは、単に文字列を検索する場合:

alt=""

...あなたはすべての空altタグを見つけることができるはずです。

いずれにせよ、考慮に(特にスペースを含む)下手に書かれたHTMLマークアップを取って、あまりにも検索のための正規表現を構築するにはあまりにも複雑ではありません。

alt\s*=\s*"\s*" 
+1

'alt = ""'が通常のテキストの一部である場合はどうなりますか? – Tomalak

+0

と二重引用符は一重引用符にすることができますが、HTMLが本当にうまくいけば引用符もないことがあります。 –

+0

うん、私はこれらの可能性を十分に認識している。 OPは私たちが知的な仮定を立てるのに十分な情報を提供していません。 – Cerebrus

0

あなたがそれをしたい場合あなたのブラウザが:notセレクタをサポートしていると仮定すると、CSSセレクタはより良いかもしれません。

selectorgadgetブックマークレットをインストールします。あなたのページでそれを有効にして、次のセレクタを入力ボックスに入れて、Enterを押します。

img:not([alt]) 

自動化してHTMLのDOMにアクセスする場合は、同じセレクタを使用できます。

関連する問題