は、以下のクラスを追加します。 @ ""); }
/// <summary>
/// Remove tags from a html string
/// </summary>
/// <param name="value"></param>
/// <returns></returns>
public static string RemoveTags(string value)
{
if (value != null)
{
value = CleanHtmlComments(value);
value = CleanHtmlBehaviour(value);
value = Regex.Replace(value, @"</[^>]+?>", " ");
value = Regex.Replace(value, @"<[^>]+?>", "");
value = value.Trim();
}
return value;
}
/// <summary>
/// Clean script and styles html tags and content
/// </summary>
/// <returns></returns>
public static string CleanHtmlBehaviour(string value)
{
value = Regex.Replace(value, "(<style.+?</style>)|(<script.+?</script>)", "", RegexOptions.IgnoreCase | RegexOptions.Singleline);
return value;
}
/// <summary>
/// Replace the html commens (also html ifs of msword).
/// </summary>
public static string CleanHtmlComments(string value)
{
//Remove disallowed html tags.
value = Regex.Replace(value, "<!--.+?-->", "", RegexOptions.IgnoreCase | RegexOptions.Singleline);
return value;
}
/// <summary>
/// Adds rel=nofollow to html anchors
/// </summary>
public static string HtmlLinkAddNoFollow(string value)
{
return Regex.Replace(value, "<a[^>]+href=\"?'?(?!#[\\w-]+)([^'\">]+)\"?'?[^>]*>(.*?)</a>", "<a href=\"$1\" rel=\"nofollow\" target=\"_blank\">$2</a>", RegexOptions.IgnoreCase | RegexOptions.Compiled);
}
}
}
私はいくつかの本当に良い開発者のブログでこのクラスを見つけましたが、私はそれを見つけたところ、残念ながら、私は覚えていないことを言わなければなりません。
は、次に、あなたが実行します。
var str = HtmlUtils.RemoveTags(yourHtmlString);
var numberOfCharacters = str.Length;
は、それが
WebBrowserコントロールは、テキストよりも多くを表示することができます願っています。たとえば、画像が含まれます。表示されているテキストの文字数を数えたいだけですか?または、ソースHTMLの文字数を数えたいですか?また、テキストボックスに表示されるテキストが変更されたときにトリガーされるTextBoxのTextChangedイベントを暗示します.WebBrowserの同等のイベントは、Navigatedのようなものになります。あなたの質問にはもっと多くの詳細が必要です。 –
あなたはhtml文書の文字を数えることについて話していますか? –
あなたのご質問にお答えできるよう、あなたの意思を明確にしてください。 –