"Yelp.com"からのクロールのためにcheerioとnightmareのノードパッケージを使用しています。私はYelp.comからデータを取得しています。 しかし、yelpが私のIPをブロックしました。 いずれかはここでは、事前に私たちのIPをブロックせずにyelp.comからデータをクロールする方法
を溶液またはsuggestions.Thanksを提供することができますしてくださいすべての要求があるように思われる同じサーバーIPアドレスから生成されているので、私のコード
var Nightmare = require('nightmare');
var fs = require('fs');
var http = require('http');
var cheerio = require('cheerio');
var request = require('request');
function yelpmenuitemsscrap(url)
{
// console.log(url);
var menuitems = new Nightmare();
menuitems.goto(url);
menuitems.wait();
menuitems.evaluate(function() {
var objs = [];
$('div.menu-sections div.media-block.menu-
item').each(function(index){
objs.push($(this).find('div.media-story h4').text().trim());
});
return objs;
},function (html) {});
menuitems.run(function(err, nightmare) {
if (err)
{
return console.log(err);
}
else
{
console.log(nightmare);
};
});
}
プロキシサーバを作成し、要件のためにオンラインにそれらを使用するために利用できる市販のソフトウェアツールオフがあります。 「ソフトウェアプロキシサーバ」でGoogle検索を行うと、あなたの要件に合ったものになります。 –
私は、複数のプロキシサーバを作成するために幾分試しました。しかし、私は得られませんでした。プロキシサーバーとその使用法を作成するためのサンプルコードを教えてください。 – siva
あなたの提案をありがとう – siva