2016-07-08 12 views
0

したがって、不動産広告をnidax.jsonファイルにスクラップする必要があります。私はすべての広告ページに行き、個々の広告へのリンクを使って必要なデータを取得します。私はNodeJS Xrayスクレーパーを使用していますが、なんらかの理由で動作しません。NodeJS Xrayは複数のサイトをクロールしてデータをスクラップできません

時には何も返されません。場合によっては、個々の広告へのリンクを返します。

var Xray = require('x-ray'); 
var x= Xray(); 
x('http://nidax-nekretnine.rs/nekretnine/','div.kutija-veca_dno > div.read-more` span ',[{ 
    url: '[email protected]' 
    items: x('div.kutija-veca_dno > div.read-more > span > [email protected]', { 
    location: 'body > div.contentarea-novo > div > div.info-part > div.one-third div.osnovni-podaci > p:nth-child(2) > span.orange-text', 
}), // follow link to google images 
}]).write('nidax.json'); 

答えて

0

pull requestが承認されたときに購読することができます。

ダウンロードしたX線モジュールで解決策を適用することをお勧めします。これは1行のコードで、2つのプロジェクトでテストしました。単純に動作します。 237行目のindex.jsファイルを参照してください。長いコメントの後に "return"を参照してください。

関連する問題