正規表現パターンの構文を理解する上で問題があります。 私はOutlook interop
を使ってemail.msgのHTMLbody
を調べています。インターネットにsrcを持つHTMLイメージタグを見つけるための正規表現パターン
インターネットへの参照があるすべての画像を削除します。 私はRegex.Replace
を使用してすべてのイメージタグを見つけ、テキストで置き換えています。
string altText = " <i>*Reference to picture on the internet removed*</i> "; string b = Regex.Replace(a, @"(<img([^>]+)>)", altText);
これは動作しますが、私は、インターネットからsrc
を持つタグを見つけたい:
これは私がきたもの、です。私は私のGoogle検索でこれを見つけた :
string matchString = Regex.Match(a, "<img.+?src=[\"'](.+?)[\"'].*?>", RegexOptions.IgnoreCase).Groups[1].Value;
しかし、すべての画像がsrc
タグを持っているように見えるので、それは助けにはなりません。私の目標は、可能であればRegex
にパターン構文を書くことです。ソース(src
)がhttp、https、またはwwwで始まるかどうかを確認します。
私にこれを手伝ってくれる人はいますか?
[Htmlの敏捷性パック](https://htmlagilitypack.codeplex.com/)を参照してくださいあなたが扱うことが可能になりますタスクを簡単な方法で実行します。 –