2012-02-10 5 views
0

誰かが良いcURLベースのPHPブラウザ/スパイダー/クローラ/ http /ファイルダウンロードライブラリを提案できますか?PHPブラウザライブラリ(多分カールあり)

は、私はちょうど私がimplode('', file(url))またはfile_get_contents()を行うだろうと同じように、のURLからコンテンツをダウンロードするためのツールを持つようにしたいが、それはタイムアウト、HTTPコード応答、カスタムヘッダーなど

カールがI「は、素晴らしいですをサポートする必要があります作成した関数でしばらく使用していましたが、カプセル化された第三者のライブラリが必要です。確かにそのようなものでなければなりません。私は検索しましたが、私が望むものを正確に見つけることができませんでした。

+0

その "ブラウザライブラリ"で探している機能 – motto

+0

ヘッダを渡してタイムアウトを設定できる 'fetchURL()'だけで十分です。 –

答えて

0

私はカールを使用して自分自身のかなりまともな機能を書いた:それは作品http://pastebin.com/4CPaCfMm

が、私は、私は私のプロジェクトで使用することができ、より高度なOOPツールを検索できても、私はちょうど、それが維持さになるだろうと開発されfurthur - 図書館。

0

これを試すことができますhttp://simplehtmldom.sourceforge.net/ parsig /ダウンロードコンテンツのためのPHPライブラリです。

+0

いいえ、それはダウンローダーではなくDOMパーサです。 –

+0

あなたは私の要点を得ていませんでした。simplehtmldomは '$ html = file_get_html( 'http://www.google.com/')で' 'これがフェッチされた返されたコンテンツを解析します。フェッチャー "。 –

+0

このパーサで画像をダウンロードすることができます – elo

0

私はWebクローラープロジェクトにPHPCrawlを使用していました。純粋にスタンドアロンのライブラリであり、cURLの依存関係はありません。

これは、指定されたURLのコンテンツを再帰的にダウンロードし、パターンマッチングとタイムアウトをサポートする機能を提供します。次に、取得したURLコンテンツで必要な処理を実行できます。ああ、それはあなたにHTTP応答のステータスを与えることができます。しかし、カスタムヘッダーについてはわかりません。