2011-08-15 11 views
1

私は正規表現とsimplehtmldomを使用してこのページから記事のタイトルを取得したい:この場合、タイトルにhttp://laperuanavegana.wordpress.com/about/regexを使用して記事のタイトルを取得するには?

がある:コモprepararセイタン

ここに私の正規表現です:

$html = file_get_html($url); 
preg_match_all("title=(.*?)",$html->innertext,$title); 
echo "this is title ".$title[0][0]."<br>"; 

それは、誰かが私にバグを見つけさせるのに役立つなら、助けになるだろう。

+1

(http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml- [あなたは正規表現でHTMLを解析しようとするべきではありません]自己完結型タグ/ 1732454#1732454) – Bohemian

答えて

2

<title></title>の間のテキストを検索する必要があると思います.のテキストには該当しません。例えば

$html = "Sometext<title>Seitan</title>More text"; 
preg_match_all('|<title>(.*?)</title>|',$html,$title); 
echo "this is title ".$title[1][0]."<br>"; 
関連する問題