2016-09-04 14 views
-2

this pageからデータを収集しています。私はシンプルなHTML DOMパーサーを使用しています。私は次のページからデータを収集したいと思います。問題は、次のページに新しいリンクがないため、リンクをループできないということです。私はそれがJavascriptによって行われると思います。次のページに移動してそこからデータを収集するにはどうすればよいですか?Simple HTML DOM PHPを使用してページをクロールする方法は?

`// array to store scraped links 
    $links = array(); 
    // crawl the webpage for links 
    foreach($html->find("a") as $link){ 
     array_push($links, $link->href); 
    }` 

上記のコードでは、ページ上のリンクのみが見つかります。ページ番号1,2,3 ...にはリンクがありません。

+0

コードを表示してください。 –

+0

私たちは知っておく必要があります、あなたは今まで何を試しましたか? –

+0

//スクレイプされたリンクを格納する配列 $ links = array(); //リンク用のWebページをクロールする foreach($ html-> find( "a")を$リンクとして使用){ \t \t \t array_push($ links、$ link-> href); } これはページにあるリンクを見つけます。ページ番号1,2,3,4,5には有効なリンクがありません。 –

答えて

0

このタスクにPhantomJS/CasperJSを使用しようとしましたか?これらは、ユーザーの要求をシミュレートしたり、Webページをスクラップしたりするのに非常に適しています。

関連する問題