以下の簡単なスクリプトは、ごみの束を返します。それはほとんどのウェブサイトのために働くが、ではないウィリアムの丘:node.jsのZombie.jsが特定のWebサイトを削るのに失敗しました
SJꪙRUݒkf6Efr2:ノード
出力と
var Browser = require("zombie");
var assert = require("assert");
// Load the page from localhost
browser = new Browser()
browser.visit("http://sports.williamhill.com/bet/en-gb/betting/y/5/et/Football.html", function() {
browser.wait(function(){
console.log(browser.html());
});
});
実行 Riz ^0 X Ή 8q / ݻ ; ׯ ׯ ׯ ٲ ڊ ڊ ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; D tvJn J 8' 햷 :: {{{{{{{¶¶¶¶¶¶¶ ¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶¶ u " z Ni "Nj \ 00_I \ 00 \ S O E8{" m; h 、o Q y ; a[ 띊띊 | | | |:::::: !}}}}}} AK = -a〜」
(実際の出力がはるかに長いです)、これはなぜ起こるか
誰もが知っている、具体的には、なぜそれが私が実際にこすりしたいだけのサイトになりますか? ??
おかげ
ヘッダーを確認してください。 DEFLATEdまたはgzippedデータを取得している可能性があります。 – You