私は動作する非常に良い正規表現を持っていて、クリック可能な文字列のURLを置き換えることができます。Regex URL画像と既存のリンクを置き換える、無視する
string regex = @"((www\.|(http|https|ftp|news|file)+\:\/\/)[_.a-z0-9-]+\.[a-z0-9\/_:@=.+?,##%&~-]*[^.|\'|\# |!|\(|?|,| |>|<|;|\)])";
ここで、クリック可能なリンクと画像を無視する方法を教えてください。
だから、文字列の下に無視:
<a href="http://www.someaddress.com">Some Text</a>
<img src="http://www.someaddress.com/someimage.jpg" />
例:
The website www.google.com, once again <a href="http://www.google.com">www.google.com</a>, the logo <img src="http://www.google.com/images/logo.gif" />
結果:
The website <a href="http://www.google.com">www.google.com</a>, once again <a href="http://www.google.com">www.google.com</a>, the logo <img src="http://www.google.com/images/logo.gif" />
完全なHTMLパーサコード:
string regex = @"((www\.|(http|https|ftp|news|file)+\:\/\/)[_.a-z0-9-]+\.[a-z0-9\/_:@=.+?,##%&~-]*[^.|\'|\# |!|\(|?|,| |>|<|;|\)])";
Regex r = new Regex(regex, RegexOptions.IgnoreCase);
text = r.Replace(text, "<a href=\"$1\" title=\"Click to open in a new window or tab\" target=\"_blank\" rel=\"nofollow\">$1</a>").Replace("href=\"www", "href=\"http://www");
return text;
HtmlParserで簡単に、ハード維持するか、読みにくい、良いに... –
あなたは正規表現でHTMLを解析しようとしていますか? –
私はこれに既に答えました[ここ](http://stackoverflow.com/a/8833696/626273) – stema