2012-03-30 31 views
0

私はこのWebページhttp://www.realtor.com/search/searchresults.aspx?mlslid=120012971&source=webをダウンロードしようとしていますが、このコードを使用してfile_get_contentsまたはcurl .Iを使用しています。php file_get_contents()がポップアップウィンドウのために機能していません

<?php 

function get_contents($url) 
{ 
    $ch = curl_init(); 
    curl_setopt ($ch, CURLOPT_URL, $url); 
    curl_setopt ($ch, CURLOPT_HEADER, 0); 
    ob_start(); 
    curl_exec ($ch); 
    curl_close ($ch); 
    return ob_get_clean(); 
} 

$url = "http://www.realtor.com/search/searchresults.aspx?mlslid=120012971&source=web"; 

//$html = file_get_contents($url); 
$html = get_contents($url); 

echo $html; 
?> 

2日前の両方のプロセスがうまくいきました。しかし、今、このページをダウンロードする問題を作成しているポップアップウィンドウがあります。元のWebページをダウンロードするポップアップウィンドウをバイパスする方法はありますか?

+0

ここをクリックして、Realtor.comの利用規約に違反していると考えています。言うまでもなく、スクラップはマークアップを変更したときにいつも壊れてしまいます。あなたはtruliaやzillowのような不動産APIを使う方が良いでしょう。 –

答えて

0

ウェブページとの対話に必要なウェブページへのアクセスのように聞こえます。マルチアクションのインタラクティブなWebエクスペリエンスを作成するには、Seleniumなどのオートメーションツールを使用する必要があります。このスイートを使用すると、DOMやJavaScriptベースのアプリケーションとの対話をスクリプト化することができます

+0

この特定のケースにどのようにセレンを使用できますか? – qmaruf

+0

これはまったく異なる質問です。 – buley