2017-04-30 4 views
3

私はサイト(https://shop.advanceautoparts.com/)を削り取ろうとしており、CasperJS経由で過去2〜3週間は通常アクセスできます。CasperJSとPhantomJSのトリガー「サイトはオフラインです」ブラウザではない

enter image description here

私は通常のブラウザまたはPhantomJSそれをオフにしようとすると、私が手に:私は(2日前のようなのような)今それをしようとすると、私はウェブサイトがオフラインであるという奇妙なメッセージが表示されます正常なサイト。私は別のコンピュータでそれをやろうとしました、私のIPを変更し、ユーザーエージェントを変更しますが、何も動作しません。

私は、同じメッセージを持って約5倍のコードを実行した後、PhantomJSで同じことをしようとした後、EDIT

。サイトで掻き傷を防ぐために何かしているのですか?

答えて

1

私は、サイトは、あなたがそれをmutltiple回

をヒットしているようたぶんあなたのユーザエージェントをランダム化し、何が起こるか見てみてください、あなたのユーザエージェントに基づいて、あなたがスクレーピングしている知っている疑いがあります。 (see list here

var casper = require('casper').create({ 
    pageSettings: { 
    userAgent: "USE SOME OTHER USER AGENT HERE" 
    } 
}); 

ただし、複数の同時要求の後でサイトがブロックしている可能性もあります。そのためにもa)は、スクリプトまたはb)別のページに移動

EDIT

を遅くしようと私は私のために一緒にテストスクリプトと、すべての作品をノックしてきました。 重要ビットは次のとおりです。

casper.waitUntilVisible("#header-top", function() {

enter image description here

HTH

+0

私はセレンを使用するときに、私はへのdocument.writeを使用して、「パーサ・ブロッキングスクリプトがあるという警告が表示されますインサート"。それはクロムが自動的にこれをブロックするように思われるので、私はそれがブロックされていると仮定します(CasperJSはロードできません)。それを取り除くための任意の提案?ページ、ユーザーエージェント、IPの変更は効果がありませんでした。 – traw1234

+0

編集しました。あなたが 'waitUntilVisible("#header-top "' – Rippo

関連する問題