一部のHTMLソースを解析しています。 HTML文書のaltタグが空であるかどうかを調べる正規表現スクリプトはありますか?正規表現でaltタグを取得する
altタグが空であるかどうかを確認します。
正規表現はこれに適していますか、C#で文字列操作を使用する必要がありますか?
一部のHTMLソースを解析しています。 HTML文書のaltタグが空であるかどうかを調べる正規表現スクリプトはありますか?正規表現でaltタグを取得する
altタグが空であるかどうかを確認します。
正規表現はこれに適していますか、C#で文字列操作を使用する必要がありますか?
HTMLタグとチェックタグを解析し、次のリンクを使用する必要があります.HTMLタグを解析するためのC#ライブラリが含まれています。タグをループしてタグ数を得ることができます。Parsing HTML tags
これが有効なXHTMLの場合、なぜRegexが必要なのですか?あなたは、単に文字列を検索する場合:
alt=""
...あなたはすべての空alt
タグを見つけることができるはずです。
いずれにせよ、考慮に(特にスペースを含む)下手に書かれたHTMLマークアップを取って、あまりにも検索のための正規表現を構築するにはあまりにも複雑ではありません。
alt\s*=\s*"\s*"
あなたがそれをしたい場合あなたのブラウザが:notセレクタをサポートしていると仮定すると、CSSセレクタはより良いかもしれません。
selectorgadgetブックマークレットをインストールします。あなたのページでそれを有効にして、次のセレクタを入力ボックスに入れて、Enterを押します。
img:not([alt])
自動化してHTMLのDOMにアクセスする場合は、同じセレクタを使用できます。
正規表現は基本的にHTMLを解析するときに問題があります(理由はCan you provide some examples of why it is hard to parse XML and HTML with a regex?を参照)。必要なのはHTMLパーサーです。さまざまなパーサーを使用した例については、Can you provide an example of parsing HTML with your favorite parser?を参照してください。
最近、私は恐ろしいregexhtml質問の不足はありますか? – annakata
@annakata:頻度の上昇があり、それも私の気持ちです。一方、一般的にはCSS/HTMLの質問が増加しています。 – Tomalak