2016-07-20 10 views
2

私は個人的に使用するためにいくつかのデータをスクラップしようとしています。ここでCasperJSのための私のコードです:私は、HTML要素の識別に問題があることを、CasperJSとPhantomJSを使用してテーブルからデータを取り出す方法

var casper = require('casper').create({ 
    verbose: true, 
    logLevel: 'debug', //debug, info, warning, error 
    pageSettings: { 
     loadImages: false, 
     loadPlugins: false, 
     userAgent: 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4' 
    }, 
    clientScripts: ["vendor/jquery-3.1.0.js", "vendor/lodash.js"] 
    }); 

var fs = require('fs'); 
var url = 'http://24score.com/football/england/premier_league/2015-2016/regular_season/averages/'; 

var content = []; 

function getContent() { 
    var content = $(x('//*[@id="total2.5"]/table/tbody[1]/tr[1]/td[1]')); 
    return _.map(content, function(e) { 
     return e.innerHTML; 
    }) 
} 

casper.start(url, function() { 

}); 

casper.then(function() { 
    content = this.evaluate(getContent); 
}); 

casper.run(function() { 
    this.echo(content).exit(); 
}); 

それはそう、私はここでのXPath、および何も仕事を使用しています。しかし、私はいくつかの要素を選択すると、それは私にいくつかの出力を与えます。

固定

答えて

2

__utils__.getElementsByXPath('//*[@id="total2.5"]/table/tbody[1]/tr[1]/td[1]') 
関連する問題