私は一部のウェブサイトを読むために(PHP)file_get_contentsを使用しています。これらのサイトにはFacebookのリンクが1つしかありません...サイト全体を取得した後、Regexを使用してURLコンテンツ全体を抽出してください
ので、いくつかの部分に存在します:私はhttp://facebook.com/usernameを取得したい
<a href="http://facebook.com/username" >
、私は "()最後に()" 最初から意味。ユーザー名は変数です... username.somethingelseかもしれませんし、 "href"の前後にいくつかの属性を持つことができます。私は非常に明確にされていないのです
念のために:
<a href="http://facebook.com/username" > //I want http://facebook.com/username
<a href="http://www.facebook.com/username" > //I want http://www.facebook.com/username
<a class="value" href="http://facebook.com/username. some" attr="value" > //I want http://facebook.com/username. some
以上のすべての例で、シングルとなる可能性があり、すべての
私はあなたがOPの読み取りのための正規表現を使用してはならない理由を説明する良いリソースを提供したかったです。しかし私は思っていたものを見つけることができませんでした。あなたが良い資源を持っているなら、Marc? – rzetterberg
これはhtml + regexがこのサイトに登場するときの標準的な答えです:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –
まあ真実私は、私はFacebookのリンクがあることを知っている文書の一部を得るためにDOMを使用しているが、その部分で私は1から6のリンクをbewtween得るだろう、どのように私はFacebookを持っているものだけを取得する –