htmlページからPHPを使用してhrefを抽出

私はニュースヘッドラインとコードを使って各見出しのリンク（href）を抽出しようとしましたが、リンク抽出が機能しません。見出しだけを取得しています。コードに何が問題なのかを教えてください。 http://web.tmxmoney.com/news.php?qm_symbol=BCM htmlページからPHPを使用してhrefを抽出

<?php 
$data = file_get_contents('http://web.tmxmoney.com/news.php?qm_symbol=BCM'); 
$dom = new domDocument; 
@$dom->loadHTML($data); 
$dom->preserveWhiteSpace = true; 
$xpath = new DOMXPath($dom); 
$rows = $xpath->query('//div'); 

foreach ($rows as $row) { 

    $cols = $row->getElementsByTagName('span'); 

    $newstitle = $cols->item(0)->nodeValue; 

    $link = $cols->item(0)->nodeType === HTML_ELEMENT_NODE ? $cols->item(0)->getElementsByTagName('a')->item(0)->getAttribute('href') : ''; 

echo $newstitle . '<br>'; 
echo $link . '<br><br>'; 
} 
?>

あなたの助けを事前に感謝を：私はから見出しとリンクを取得したいからページへ

リンク！

出典

2016-11-17 Tim

はこれを行うにしてください：

<?php 
    $data= file_get_contents('http://web.tmxmoney.com/news.php?qm_symbol=BCM'); 

    $dom = new DOMDocument(); 
    @$dom->loadHTML($data); 
    $xpath = new DOMXPath($dom); 
    $hrefs= $xpath->query('/html/body//a'); 

    for($i = 0; $i < $hrefs->length; $i++){ 
    $href = $hrefs->item($i); 
    $url = $href->getAttribute('href'); 
    $url = filter_var($url, FILTER_SANITIZE_URL); 

    if(!filter_var($url, FILTER_VALIDATE_URL) === false){ 
     echo '<a href="'.$url.'">'.$url.'</a><br />'; 
    } 
    } 
?>

出典

2016-11-17 20:52:19

お返事ありがとうございます。あなたのコードはウェブページからのリンクをエコーしますが、見出しには属しません（ニュースリリース）。私が質問に貼り付けたコードはすべてのニュース（見出し）をエコーしますが、それぞれの見出しのリンクはありません。私はあなたのコードを使って遊んだりしようとしました（$ hrefsを変更することを含めるが、うまくいきませんでした）。十分な時間がある場合はもう一度お試しください。再度、感謝します！ – Tim

申し訳ありませんが、Webページにアクセスできないため、コードをテストできません。 –

私は解決策を発見しました。ここに行く：

<?php 

$data = file_get_contents('http://web.tmxmoney.com/news.php?qm_symbol=BCM'); 
$dom = new domDocument; 
@$dom->loadHTML($data); 
$dom->preserveWhiteSpace = true; 
$xpath = new DOMXPath($dom); 
$rows = $xpath->query('//div'); 

foreach ($rows as $row) { 

    $cols1 = $row->getElementsByTagName('a'); 

    $link = $cols1->item(0)->nodeType === XML_ELEMENT_NODE ? $cols1->item(0)->getAttribute('href') : ''; 

    $cols2 = $row->getElementsByTagName('span'); 

    $title = $cols2->item(0)->nodeValue; 
    $source = $cols2->item(1)->nodeValue; 

echo $title . '<br>'; 
echo $source . '<br>'; 
echo $link . '<br><br>'; 

} 
?>

出典

2016-11-18 07:51:19 Tim

htmlページからPHPを使用してhrefを抽出

答えて

関連する問題