CheerioとjQueryについて学ぶサンプルテストスクレーパーをビルドしました。Cheerio Node.JS外部タイトルリンクの問題
URLのグループを受け取って保存した後で、そのURLをロードしてそのページのヘッダーからタイトルを取得するという別の要求を行った後で、二次要求で頭が痛いです。
私のコードは次のようになっています。
var request = require('request'),
cheerio = require('cheerio');
urls = [];
titles = [];
request('http://reddit.com', function(err, resp, body){
if(!err && resp.statusCode == 200){
var $ = cheerio.load(body);
$('a.title', '#siteTable').each(function(){
var url = $(this).attr('href');
urls.push(url);
});
//issue is here
for(var i = 0; i < urls.length; i++){
request(urls[i], function(err, resp, body){
var $ = cheerio.load(body);
var title = $("title").text();
console.log(title);
});
}
}
});
ページからタイトルを付けるとどこかに不確定なプロパティが表示されるようです。
私はjQueryの新機能だと言わなければならないので、このコードはおそらくばかげているようです(私は仮定しています)。
私はコンソールからの受信エラーは、
TypeError: Cannot read property 'parent' of undefined
at Function.exports.update (/home/pi/node_modules/cheerio/lib/parse.js:55:25)
at module.exports (/home/pi/node_modules/cheerio/lib/parse.js:17:11)
at Function.exports.load (/home/pi/node_modules/cheerio/lib/static.js:19:14)
at Request._callback (/home/pi/scraper.js:16:22)
at self.callback (/home/pi/node_modules/request/request.js:187:22)
at Request.emit (events.js:95:17)
at Request.init (/home/pi/node_modules/request/request.js:275:17)
at new Request (/home/pi/node_modules/request/request.js:129:8)
at request (/home/pi/node_modules/request/index.js:55:10)
at Request._callback (/home/pi/scraper.js:15:6)
である私は、このエラーは、私は、変数未定義を持っていると私は.somethingをのような二次的属性だけに、エラー箇所を作るしようとしていることを意味していることを理解しますコールバック関数は2番目の必須です。
私はこれをどのように修正できるかに関するアドバイスはありますか?
2番目の変数定義の後にカンマの代わりにセミコロンを使用したので、多くの変数がグローバルであることに注意してください。 – adeneo