2012-04-02 9 views
0

phpcrawlerの最新バージョンをダウンロードしました。私自身のテストウェブサイトにアクセスできます。画像や本サイト上のいくつかのテキストを持っている私は、私はクローラを実行すると、私は適切な$crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");PHPクローラー - tmpファイル

をしたので、私は、私はそれがTMPファイルにそれを保存するために得ることができないテキストマイナスイメージを受け取る

ユニークなファイルを保存しませんtmp私はクローラを実行するフォルダ内のファイルを、私は幸運を命名されたファイルを保存しようとしました。

私は、すべてのPHPファイルのさまざまな行で多くの償却されたエラーに遭遇しました。例えば、@fopen@は異なるエリアの問題を引き起こします。私はPHPを使用し、Regexも行うことができます。デビッド。 。

答えて

0

PHPCrawlerの質問は本当に答えられないことがわかりましたので、私自身の質問に答えました。私は昨年からの質問に答えなかった。私もそれに答えるだろうが、何か良いことを行うには遅すぎるかもしれない。これが答えです。

私は私のニーズに合わせて調整修正phpcrawlerに追加:

$fp = fopen('c:/test/poopoo.txt','w'); 
fwrite($fp,($page_data['source'])); 
fclose($fp); 

あなたは、ファイルをフラッシュする前にそれを置くと、クラスのインスタンスを作成します。

PHP Simple HTML DOM Parserを使用してわかりました。this projectからうまく機能します。より多くのコントロールを使用する必要がある場合RegExp、しかしそれは急な学習曲線を持っています。

+0

修正のおめでとう、そしてPHPCrawlerのサブコミュニティを見つけてくれてありがとう!あなたができるときは、他の人があなたの成功から学ぶことができるように、あなたの答えに「受け入れられた」と記入してください。乾杯〜 –

関連する問題