C#で正規表現を使用するのが難しいです。私がする必要があるのは、特定の文字列を見つけてその文字列内の特定の単語だけを保持することです。ここでC#正規表現.Replace
は私のコードです:私は入れて色違いがあることができるのでここで
reg = new Regex("<td></td><td><Span class=\"abc\"><Span style=\"color:#......;\"><B>(.*?)</td></tr>");
は、私が取得する一意の文字列です......(コードの色は常に6つの文字である)、および(。*?)は、私が保存したい特定の単語です。
this.varToSave = reg.Match(data).Value.Replace("<td></td><td><Span class=\"abc\"><Span style=\"color:#......;\"><B>", "").Replace("</td></tr>", "");
は、私はすべてを消去し、唯一の私の言葉を維持したいが、それは動作しません(*?。):
その後、それはこのように書きます。 ( ""、 "")のみが消去されます。私は置き換えコードの "......"の問題だと思いますが、これを修正する方法はわかりません。
ありがとうございます。
HTMLを正規表現で解析しないでください。ユーモラスな説明はhttp://stackoverflow.com/a/1732454/960195を参照してください。 –
Regexを使用する必要がない場合、探しているのは "Web Scraper"ですか?おそらく:http://stackoverflow.com/questions/4377355/i-need-a-powerful-web-scraper-library – Jason
もう一つのリンクhttp://stackoverflow.com/questions/1732348/regex-match-open-tags -except-xhtml-self-contained-tags/1758162#1758162あなたは[HTML Agility Pack](http://htmlagilitypack.codeplex.com/)を試しましたか? –