2016-04-17 8 views
0

これはsame-origin policyに違反することなくどのように行われますか? http://anyorigin.com/のようなWebサイトを使用しようとしましたが、うまくいきません。これをどうやって起こさせるのですか?Javascriptを使用してクライアントサイドのWebスクレイピングを実行するにはどうすればよいですか?

+0

は私の[ポスト](http://scraping.pro/web-scraping-with-javascript-load-html-を参照してください。

は、単にあなたの文書に以下のものが含まれます私のJSの経験では/ page)。 –

答えて

0

YahooのYQL(Yahoo Query Language)はXPathを使って、ページのHTMLの要素をオンラインで見つけることができます。

<div id="a"></div> 
 
<script> 
 
    var yqlCallback = function(data){ 
 
    \t var rep = data.query.results.div; 
 
     document.getElementById('a').innerHTML = "StardustGogeta's reputation is "+rep+'.'; 
 
    }; 
 
</script> 
 
<script type='application/javascript' src="https://query.yahooapis.com/v1/public/yql?q=select%20content%20from%20html%20where%20url%3D'http%3A%2F%2Fstackoverflow.com%2Fusers%2F5732397%2Fstardustgogeta'%20and%20xpath%3D'%2F%2Fdiv%5B%40class%3D%22reputation%22%5D'&format=json&env=store%3A%2F%2Fdatatables.org%2Falltableswithkeys&callback=yqlCallback"></script>