2009-06-10 20 views
2

私の仕事は法的な目的で一連のウェブページのスクリーンショットを撮ることです。私は現在Webshotを使ってこれを達成しており、自分自身でコンパイルしたURLのリストを使ってバッチ操作を実行しています。また、IECaptとその遅延機能を使って行われる、回転するFlashバナーのスクリーンショットを撮る必要があります。ウェブサイトをクロールして各ページのスクリーンショットを撮るには?

各ページには一連の広告が表示されます。これらの広告には、表示されるページのスクリーンショットが必要です。リンク後に各リンクをクリックして時間を費やさないようにするには、どうすればこの作業を自動化できますか?

明らかでない場合は、ホームページには4つの異なる商品ページにリンクする4つのセカンダリ広告があります。私はホームページのスクリーンショット(完了)と、広告がリンクするページの4つの異なるスクリーンショットが必要です。

ああ、物事は面白くするために、ホームページを使っJavascriptがラをリダイレクト:

javascript:dcsOnsiteAdLink('url', '/whyjoin', 'ad', 'S1', 'popup', 'toolbar=yes,location=yes,directories=yes,status=yes,menubar=yes,scrollbars=yes,resizable=yes,width=780,height=500'); 

答えて

5

のgnome-ウェブ写真はレンダリングし、ウェブページのスナップを取るためにGEKOエンジンを使用しています。それはかなり気の利いたスクリプト可能です。

7

ElanceまたはMechanical Turkを通じて、あなたに3ドル/時間の支払いをしてください。スクリプトを一緒にハッキングするのに4時間しか費やしていないとしても、誰かにそれを支払うよりも多くの費用がかかります。

+0

開発者として、私は依存関係をたくさん持っていると私はすぐに解放することができるようにしたいサイトを管理するかもしれないので、これは理想的ではありません。私はこのために既に作られた多くのキャスパースクリプト、あるいはこれを試してみることをお勧めします:https://www.npmjs.com/package/crawl – jasongonzales

3

Adob​​e Acrobat Proはこれでかなり役に立ちます。サイト全体を把握し、単一のインデックス付きドキュメントにすることができます。スクリーンショットは画面上のものだけを表示し、Acrobat Proはページ全体を表示します。

関連する問題