私は、上記のサイトからの選択的な文を解析するためのPHP Webクローラーを持っています。PHP Webクローラーのライブラリ(guzzle)を呼び出していますか?
それが正常に働いていたが、私は、サイトの複数のページを解析することにwhileループを追加したとき、それはWarning: require_once(github.com/guzzle/guzzle): failed to open stream: No such file or directory
としてエラーを来た私はhttps://github.com/guzzle/guzzle
からがつがつ食うフォルダをダウンロードしたが、それでも正しい識別のように思えるんでした私のスクリプトでは正しく実行されていません。
として私のスクリプトが行く:実際に返すことになって何
が<?php
$i = 1;
while(true){
require_once('github.com/guzzle/guzzle');
$subject = file_get_html('http://www.usmleforum.com/forum/index.php?forum=1&Page='+$i);
preg_match_all('/<td.+?FootNotes2.+?<a.+?<\/a> - (?P<name>.*?)<\/td>.+?<td.+?FootNotes2.+?(?P<date>\d{2}\/\d{2}\/\d{2} \d{2}:\d{2})/siu', $subject, $matchs);
foreach ($matchs['name'] as $v){
echo $v. " ";
}
foreach ($matchs['date'] as $v){
echo $v. " ";
}
}
$i++;
?>
サイト内のすべてのページの名前や日付などのテキストとしてタグ付きテキストを印刷することである
すべてのヘルプは高く評価され、 ..
私はフォルダの名前をどのようにすればよいですか ? – harishk
好きですが、require_onceはファイル(http://php.net/manual/en/function.require-once.php) –
のためだけです。実際には、require_onceやguzzle'と 'whileループ '、それは正常に働いたが、その後、すべてのページからデータを取得するループを追加し、それはエラーを示したので、友人はこのおじさんの事を追加することを提案..これはかなり新しい?\ – harishk