記事の内容のURLを取得

ページの内容（HTML）があれば、記事の内容をどのように入手できますか？例えば記事の内容のURLを取得

、このウェブサイトはURL与えられた記事の内容を返します。

http://embed.ly/docs/explore/extract?url=http%3A%2F%2Fwww.foxnews.com%2Fsports%2F2016%2F08%2F14%2Fryan-lochte-3-other-u-s-swimmers-robbed-in-brazil.html

しかし、私は彼らのAPIを使用する必要はありません。私はfile_get_contents($url)を使用しましたが、私はの内容を取得する方法については何も考えていません。

アイデア？

出典

2016-08-14 user6715530

あなたは 'file_get_contents（$ url）'の出力を解析し、あなたが興味を持っている部分を保持する必要があります。 –

正規表現またはsubstr、strstr、strpos、...関数についてはどうですか？ –

@OrryVandermeulenいいえ、組み込みのパーサを使用してください。 – chris85

$url = 'http://www.foxnews.com/sports/2016/08/14/ryan-lochte-3-other-u-s-swimmers-robbed-in-brazil.html'; 
$content = file_get_contents($url); 
$first_step = explode('<div class="article-text">' , $content); 
$paras = explode("<p>" , $first_step[1]); 

foreach($paras as $para) { 
    echo $para; 
}

画像とともにコンテンツを取得したい場合はdomタグの構造で使用されている記事タグも使用します。

出典

2016-08-14 19:39:21 owaishanif786

'article-text'に決して内部に' div'がありません。 – chris85

答えて

関連する問題