WindowsサーバでPHP(6.0以上)を使用してWebページを取得することができると聞きました。どの言語でも、ウェブページをキャプチャしてイメージファイルに保存できますか? (no install、no activeX)
サンプルコードを入手してテストしました。正しく実行するコードはありません。
ウェブページをキャプチャする正しい方法がわかっている場合は、ウェブアプリケーションにイメージファイルを保存しますか?
私に教えてください。
WindowsサーバでPHP(6.0以上)を使用してWebページを取得することができると聞きました。どの言語でも、ウェブページをキャプチャしてイメージファイルに保存できますか? (no install、no activeX)
サンプルコードを入手してテストしました。正しく実行するコードはありません。
ウェブページをキャプチャする正しい方法がわかっている場合は、ウェブアプリケーションにイメージファイルを保存しますか?
私に教えてください。
ウェブページのhtmlをダウンロードすることは、一般的にスクリーンスクレイピングと呼ばれています。これはプログラムが特定のページからデータを抽出したい場合に便利です。 HTTPリソースを要求する最も簡単な方法は、ツールコールcURLを使用することです。 cURLはスタンドアロンのUNIXツールとして提供されていますが、すべてのプログラミング言語で使用するライブラリがあります。 Unixコマンドラインのタイプから、このページをキャプチャするには:PHPで
curl http://stackoverflow.com/questions/1077970/in-any-languages-can-i-capture-a-webpageno-install-no-activex-if-i-can-plz
、あなたは同じことを行うことができます。
<?php
$ch = curl_init() or die(curl_error());
curl_setopt($ch, CURLOPT_URL,"http://stackoverflow.com/questions/1077970/in-any-languages-can-i-capture-a-webpageno-install-no-activex-if-i-can-plz");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$data1=curl_exec($ch) or die(curl_error());
echo "<font color=black face=verdana size=3>".$data1."</font>";
echo curl_error($ch);
curl_close($ch);
?>
今すぐWebサイト全体をコピーする前に、あなたはに彼らのrobots.txtファイルをチェックする必要がありますロボットが自分のサイトをスパイダーすることを許可するかどうかを確認し、HTMLなしでデータを取得できるAPIがあるかどうかを確認することができます。
なぜ投票が嫌いですか?答えは明らかに今はたくさんの意味を成していませんが、質問が4回変わる前のことでした。 – brianegge
PHPソリューションを依頼しましたが、Perlとは別のソリューションをご紹介したいと思います。 WWW::MechanizeとLWP::UserAgentおよびHTML::Parserは、スクリーンスクレイピングに役立ちます。参照用
一部のドキュメント:
あなたが本当にほぼすべての言語を使用することができ、XML-RPCインタフェースでbrowsershotsのAPI http://browsershots.org/
を使用することができますそれにアクセスする。
あなたは文字通りWebページがどのように見えるかの画面キャプチャをしたいですか? ie ExplorerやFirefoxでどのように見えますか? ウェブページを作るファイル、テキスト、HTMLを入手したいですか? – elviejo79