私は、テキストファイルからURLs
とInnerTexts
の両方を取得しようとしています正規表現 - すべてのhrefとinnerTextを取得しますか? C#で
、私はこれだけ正規表現を持って使用していますデバイス(テキストファイルのみ)上のDOMオブジェクトへのアクセスを持っていません使用する。
<a href="/LinkClick.aspx?fileticket=a random text string">I want this text</a>
私は、テキストファイル全体のすべてのこれらのセットが必要になりますHTMLを解析するために
URL = /LinkClick.aspx?fileticket=a random text string
TITLE = I want this text
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Joe
RegExを使用してデータを解析しようとするのは良い考えではありません。 HTMLテキストファイルがある場合は、DOMにアクセスできます。たとえば、 "using System.Windows.WebBrowser ... HtmlDocument hdoc = HtmlPage.Document;" – paulsm4
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1758162#1758162 –