0
ページの内容(HTML)があれば、記事の内容をどのように入手できますか?例えば記事の内容のURLを取得
、このウェブサイトはURL与えられた記事の内容を返します。
しかし、私は彼らのAPIを使用する必要はありません。私はfile_get_contents($url)
を使用しましたが、私はの内容を取得する方法については何も考えていません。
アイデア?
ページの内容(HTML)があれば、記事の内容をどのように入手できますか?例えば記事の内容のURLを取得
、このウェブサイトはURL与えられた記事の内容を返します。
しかし、私は彼らのAPIを使用する必要はありません。私はfile_get_contents($url)
を使用しましたが、私はの内容を取得する方法については何も考えていません。
アイデア?
$url = 'http://www.foxnews.com/sports/2016/08/14/ryan-lochte-3-other-u-s-swimmers-robbed-in-brazil.html';
$content = file_get_contents($url);
$first_step = explode('<div class="article-text">' , $content);
$paras = explode("<p>" , $first_step[1]);
foreach($paras as $para) {
echo $para;
}
画像とともにコンテンツを取得したい場合はdomタグの構造で使用されている記事タグも使用します。
'article-text'に決して内部に' div'がありません。 – chris85
あなたは 'file_get_contents($ url)'の出力を解析し、あなたが興味を持っている部分を保持する必要があります。 –
正規表現またはsubstr、strstr、strpos、...関数についてはどうですか? –
@OrryVandermeulenいいえ、組み込みのパーサを使用してください。 – chris85