2017-04-24 9 views
-5

私はWikipediaの記事のhtmlコード(文字列)をスキャンする正規表現を書く必要があります。これは、Wikipediaの他の記事へのリンクです。Wikipediaの記事への内部リンクと一致するようにC#で正規表現を書くには?

リンクは通常、例えばこれらのようになります。それが動作"<a.*href=(\"|')(.+?)(\"|')*wiki.*>" が、それはまた、画像だけでなく、記事へのリンクと一致します。

<a href="/wiki/English Language" title="English Language">English</a>

<a href="/wiki/Spanish Language" title="Spanish Language">Spanish</a> 

を私は正規表現を試してみました。

+1

1.何をやってみましたか? * *なぜ*正規表現を使用したいですか? – UnholySheep

+0

参照http://stackoverflow.com/a/31805829/ – user326608

+0

[HTMLページのすべてのリンクを取得しますか?](http://stackoverflow.com/questions/2248411/get-all-links-on-html-ページ) – csharpbd

答えて

0

私はついに成功しました。リンクの先頭に正規表現を書いています:

(@"<a href=""/wiki/[A-Z][A-Za-z0-9\-\-_]+""") 
関連する問題