2
私は個人的に使用するためにいくつかのデータをスクラップしようとしています。ここでCasperJSのための私のコードです:私は、HTML要素の識別に問題があることを、CasperJSとPhantomJSを使用してテーブルからデータを取り出す方法
var casper = require('casper').create({
verbose: true,
logLevel: 'debug', //debug, info, warning, error
pageSettings: {
loadImages: false,
loadPlugins: false,
userAgent: 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4'
},
clientScripts: ["vendor/jquery-3.1.0.js", "vendor/lodash.js"]
});
var fs = require('fs');
var url = 'http://24score.com/football/england/premier_league/2015-2016/regular_season/averages/';
var content = [];
function getContent() {
var content = $(x('//*[@id="total2.5"]/table/tbody[1]/tr[1]/td[1]'));
return _.map(content, function(e) {
return e.innerHTML;
})
}
casper.start(url, function() {
});
casper.then(function() {
content = this.evaluate(getContent);
});
casper.run(function() {
this.echo(content).exit();
});
それはそう、私はここでのXPath、および何も仕事を使用しています。しかし、私はいくつかの要素を選択すると、それは私にいくつかの出力を与えます。
固定