問題の概要私は、Webページにリンクする検索結果から構成され、動的に生成ウェブページ、X
、Y1
、Y2
、Y3
など XMLHTTPRequest経由でロードされたWebページからURLを抽出する最適な方法は?
Y1
がリソースURLが含まれている
R1
、Y2
リソースURLR2
などが含まれています。 私は動的にリソース
- 、
R2
など
R1
へのリンクがページ
X
を強化したいと思います
解決策
私は現在、HTMLを取得するために、JavaScriptとXMLHTTPRequestをを使用してと思っていますウェブページY1
、Y2
などから、に正規表現を使用してURLを抽出します。
ページY1
,Y2
などは、それぞれ30-100KBのHTML領域にあります。
これは良い計画のようですか?または、JSON形式で各Webページを取得し、そこからリソースURLを抽出する方が良いでしょうか? HTMLを使用する方法があれば、30-100 KBのテキストを検索するための推奨された最適化/ショートカットがありますか?
は残念ながら、jQueryのはオプションではありません。しかし、私は代わりの音が好きです - 歓声! –