Nodejsで「https://www.ukr.net/ua/news/sport.html」というページを削りたい。 I`mは、「要求」NPMモジュールの基本的なGETリクエストをしようと、ここでの例です:ノードを掻き集める
const inspect = require('eyespect').inspector();
const request = require('request');
const url = 'https://www.ukr.net/news/dat/sport/2/';
const options = {
method: 'get',
json: true,
url: url
};
request(options, (err, res, body) => {
if (err) {
inspect(err, 'error posting json');
return
}
const headers = res.headers;
const statusCode = res.statusCode;
inspect(headers, 'headers');
inspect(statusCode, 'statusCode');
inspect(body, 'body');
});
しかし、私はポストマンからの要求を得ることを確認した場合、応答本体に、私は唯一の
body: '<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01
Transitional//EN">\n<html>\n<head>\n<META HTTP-EQUIV="expires"
CONTENT="Wed, 26 Feb 1997 08:21:57 GMT">\n<META HTTP-EQUIV=Refresh
CONTENT="10">\n<meta HTTP-EQUIV="Content-type" CONTENT="text/html;
charset=utf-8">\n<title>www.ukr.net</title>\n</head>\n<body>\n
Идет загрузка, подождите .....\n</body>\n</html>'
を取得し、私は私が必要とする正確に何を得る:
私の男を助けてください。
'Идетのзагрузкаは、подождите.....' = 'ロード、待ってください....' - あなたがこすりしようとしているページが動的にロードされた要素を持っているので、あなたの最初のリクエストには、代わりに "読み込み中"のメッセージが表示されます。おそらく、あなたのページをレンダリングするためにファンタムjsのようなものを使うことができますか? http://stackoverflow.com/a/31059035/459517 - 郵便配達員はおそらくこのようなことを自動的に行っています。 – Robbie