2011-04-05 7 views
-1

をこする画面でヘッダを送信したい... リンク:screen scraping in php problemは、私は問題をこする画面にまだstucked午前

この問題はありませんが低下し、Googleの検索クエリに'&num=100'を使用して少しの程度まで解決されました。要求の10回。しかし、キャプチャの問題はまだdereです。だから私はそれを克服するために... sleep(seconds)機能。

今問題は私自身(これらは命令です)です。つまり、このケースでは警告を受け取りにくく、エラーが難しいため 'simple_html_dom.php'を使用したくないということです。私自身。だから私はそれを行うことができます。私はメソッドに知っている:1. file_get_content()2.カール。 RegEx match open tags except XHTML self-contained tags

タスク実装へ:

しかし、ウルコンテンツを検索し、DOMを解析するために定期的なEXPを使用してsimultaneously.asランクを数えるフェッチするのは非常に面倒な作業はconvencing urself.linkは、このリンクHELL.readです

  1. catch captchaエラー(または警告)が表示されるので、実行を停止することができます。
  2. headers.soを使用しなければならないのは、本物で有効なGoogleの人間工学的要求です。

    simple_html_dom.phpキャッチエラーerrors.itは、キャプチャエラーが発生したときに警告を表示します。どのように警告を受け取ることができますか? 助けてください...このモジュールで長年働いています。ここに関連するすべての問題を解決するための提案をお願いします。

答えて

0

最初の問題(キャプチャ)を知ってはいけない、しかし、あなたが例えば、カールで簡単にヘッダーを送信することができます

​​

とユーザーエージェントを設定する:

curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (X11; Linux x86_64; rv:2.2a1pre) Gecko/20110324 Firefox/4.2a1pre'); 
+0

ありがとう..iは似たようなものを探していました...私はphp.netのリンクリストol possilble 'CURLOPT_ 'オプションを送ることができますか? –

+0

http://in.php.net/manual/en/function.curl-setopt.php。すべてのcurlopt_オプションのリスト.. –

関連する問題