2016-08-14 9 views
0

ページの内容(HTML)があれば、記事の内容をどのように入手できますか?例えば記事の内容のURLを取得

、このウェブサイトはURL与えられた記事の内容を返します。

http://embed.ly/docs/explore/extract?url=http%3A%2F%2Fwww.foxnews.com%2Fsports%2F2016%2F08%2F14%2Fryan-lochte-3-other-u-s-swimmers-robbed-in-brazil.html

しかし、私は彼らのAPIを使用する必要はありません。私はfile_get_contents($url)を使用しましたが、私はの内容を取得する方法については何も考えていません

アイデア?

+1

あなたは 'file_get_contents($ url)'の出力を解析し、あなたが興味を持っている部分を保持する必要があります。 –

+0

正規表現またはsubstr、strstr、strpos、...関数についてはどうですか? –

+1

@OrryVandermeulenいいえ、組み込みのパーサを使用してください。 – chris85

答えて

3
$url = 'http://www.foxnews.com/sports/2016/08/14/ryan-lochte-3-other-u-s-swimmers-robbed-in-brazil.html'; 
$content = file_get_contents($url); 
$first_step = explode('<div class="article-text">' , $content); 
$paras = explode("<p>" , $first_step[1]); 

foreach($paras as $para) { 
    echo $para; 
} 

画像とともにコンテンツを取得したい場合はdomタグの構造で使用されている記事タグも使用します。

+1

'article-text'に決して内部に' div'がありません。 – chris85

関連する問題