2017-06-09 2 views
0

1x1のサイズのHTML文字列で画像タグを見つける方法を知りたいのですが、基本的にはトラッキングピクセルを探しています。したがって、たとえば:C#HTMLで1x1イメージタグを見つける方法

<img src=\"http://somewhere.com\" width=\"1\" height=\"1\" style=\"display:none!important;\"> 

最後の目標は、コードのこの部分を見つけて文字列から削除することです。

私はすべてのimgタグを見つける方法についてすでにいくつかの記事を読んでいますが、それは私が探しているものではありません。私は1x1のimgタグだけが必要です。

誰でも助けてもらえますか?

+2

幅と高さはCSS –

+0

からも設定できます。私は次の繰り返しのためにそれを念頭に置いておきます。 – cbutler

答えて

2

を見て、あなたは正規表現でそれを行うことができます。

string result = Regex.Replace(html, "<img.+?(width|height)=[\"']1[\"'].+?(width|height)=[\"']1[\"'].*>", "", RegexOptions.IgnoreCase); 
+0

これは、width = '1'またはwidth = "1"と一致しますが、width = \ "1 \"は一致しないため、間違っています。 width = "1"。[\ "']'(\\ "1 \\" |' 1 ')'に変更する必要があります。 –

+0

これはうまくいきました私の即時のニーズ!私はまだHTMLアジリティパック – cbutler

3

そうでもない正規表現でHTMLを解析するのに非常に良い練習が、私はあなたが<img.*?>ですべて<img>のタグを取得し、定期的な

if (str.IndexOf("width=\"1\"" > 0 && str.IndexOf("height=\"1\"") > 0) 

を行うcolud推測するが、そこにはるかにある、と私は提案しますあなたは自分の文字列からこのimgタグを削除したい場合は、HTML Agility Pack

+0

ありがとうドミトリー! D – cbutler

関連する問題