私はphantomJS
を使用して、Network
タブからすべてのリクエストURLを取得していますが、不要なリクエストも増えています。PhantomJS onResourceReceivedが予想よりも多くの結果を返します
例えば、あなたがmarvel.comに行くと、Networkタブには117のリクエストがあり、私のスクリプトは142の結果を返します。さらに、ネットワークタブからこれらの117のリクエストを取得する方法はありますか? ?
これは私のコードです:
var urls = ["https://marvel.com"];
var page = require('webpage').create();
var links = "";
var fs = require('fs');
var path = 'TestOutput.txt';
function handle_page(url){
page.open(url,function(){
fs.write(path, links, 'w');
next_page();
});
page.onResourceReceived = function(response) {
if(links.indexOf(response.url) == -1 && response.url.indexOf("http") !== -1) {
links += response.url + '\n';
}
}
links += '\n';
links += '-------------------------------------------------------------------------------------------------';
links += '\n';
}
function next_page(){
var url = urls.shift();
if(!url) {
phantom.exit(0);
}
handle_page(url);
}
next_page();
あなたが「不要」とはどういう意味ですか? Chromeでサイトを開き、devtoolsの[ネットワーク]タブに123のリクエストがありました。どのようにしてそれらのいずれかが欲しいかどうかできますか? – Vaviloff
私はなぜネットワークのタブからの要求の数よりも多くを得ているのだろうか...私はちょうどネットワークのタブに表示される要求から要求URLを取得したいと思います。それは理にかなっていますか? – Valip