2011-10-06 6 views
0

問題の概要私は、Webページにリンクする検索結果から構成され、動的に生成ウェブページ、XY1Y2Y3など XMLHTTPRequest経由でロードされたWebページからURLを抽出する最適な方法は?

  • Y1がリソースURLが含まれている

    • R1Y2リソースURL R2などが含まれています。
    • 私は動的にリソース R1へのリンクがページ Xを強化したいと思います
    • R2など

    解決策

    私は現在、HTMLを取得するために、JavaScriptとXMLHTTPRequestをを使用してと思っていますウェブページY1Y2などから、に正規表現を使用してURLを抽出します。

    ページY1,Y2などは、それぞれ30-100KBのHTML領域にあります。

    これは良い計画のようですか?または、JSON形式で各Webページを取得し、そこからリソースURLを抽出する方が良いでしょうか? HTMLを使用する方法があれば、30-100 KBのテキストを検索するための推奨された最適化/ショートカットがありますか?

  • 答えて

    1

    正規表現を使用してURLを抽出したくない場合。 jQueryを使用してAJAXリクエストを実行し、jQueryを使用して、サーバーから返されたHTMLからURLを解析して除外することをお勧めします。

    jQuery.ajax({ 
        url: "http://my.url.here", 
        dataType: "html"; 
        ... 
        success: function(data) { 
         jQuery("a", data).each(function() { 
          var $link = jQuery(this); 
          ... 
          ... 
         }); 
        } 
        ... 
    }); 
    

    jQueryのオプションではない場合、あなたの応答を取り戻すとき、あなたはこのような何かを行うことができます。

    var html = XHR.responseText; 
    var div = document.createElement("div"); 
    div.innerHTML = html; 
    
    //you can now search for nodes inside your div. 
    //The following gives you all the anchor tags 
    div.getElementsByTagName('a'); 
    ... 
    
    +0

    は残念ながら、jQueryのはオプションではありません。しかし、私は代わりの音が好きです - 歓声! –

    関連する問題