Simple HTML DOM PHPを使用してページをクロールする方法は？

-2

this pageからデータを収集しています。私はシンプルなHTML DOMパーサーを使用しています。私は次のページからデータを収集したいと思います。問題は、次のページに新しいリンクがないため、リンクをループできないということです。私はそれがJavascriptによって行われると思います。次のページに移動してそこからデータを収集するにはどうすればよいですか？Simple HTML DOM PHPを使用してページをクロールする方法は？

`// array to store scraped links 
    $links = array(); 
    // crawl the webpage for links 
    foreach($html->find("a") as $link){ 
     array_push($links, $link->href); 
    }`

上記のコードでは、ページ上のリンクのみが見つかります。ページ番号1,2,3 ...にはリンクがありません。

出典

2016-09-04 Tamim Ibn Aman

コードを表示してください。 –

私たちは知っておく必要があります、あなたは今まで何を試しましたか？ –

//スクレイプされたリンクを格納する配列 $ links = array（）; //リンク用のWebページをクロールする foreach（$ html-> find（ "a"）を$リンクとして使用）{ \t \t \t array_push（$ links、$ link-> href）; } これはページにあるリンクを見つけます。ページ番号1,2,3,4,5には有効なリンクがありません。 –

このタスクにPhantomJS/CasperJSを使用しようとしましたか？これらは、ユーザーの要求をシミュレートしたり、Webページをスクラップしたりするのに非常に適しています。

出典

2016-09-04 08:06:03

Simple HTML DOM PHPを使用してページをクロールする方法は？

答えて

関連する問題