動的コンテンツを読み込むためにJavaScriptを使用するウェブサイトから一部のコンテンツをスクラップします。以前は、私はリクエストとcheerioを掻き集めて使用しましたが、うまくいきました。しかし、私はちょうど要求とcheerioが動的コンテンツを掻き取ることができないことを知ります。研究をした後、私はのphantomjsを見つけました。ページがロードされた後にすべてのコンテンツを取得できます。私は今それに問題がある、私は使用することはできませんjQueryセレクタ私はcheerioで使用されていたようです。これは私のサンプルコードですが、セレクタは何も返しません。PhantomjsでjQueryを使用してhtml要素を選択するには?
var page = require('webpage').create();
var url = 'http://angkorauto.com/vehicle';
page.open(url, function (status) {
if (status !== 'success') {
console.log('Unable to load the address!');
phantom.exit();
} else {
window.setTimeout(function() {
// console.log(page.content);
page.includeJs('https://cdnjs.cloudflare.com/ajax/libs/jquery/3.1.1/jquery.min.js', function(){
page.evaluate(function(){
console.log($('.divTitle').find('a').attr('href'));
});
});
phantom.exit();
}, 1500);
}
});
この問題を解決できますか?私は今本当に立ち往生している。
ご協力いただきありがとうございます。
あなたもこれだけのウェブサイト(ankkorauto.com)またはいくつかの他のウェブサイトからこすりしたいですか? –
リクエストがあれば他にも欲しい、チエリオは使えない –
何? cheerioって何? –