2016-05-16 5 views
0

xidelページングのHTMLに従う方法とURLを抽出する方法私は、この例のように改ページを持つWebサイトでテストバッチおよびxidel でWindows 7で

リンク1

LINK2

LINK3

2 3 4 5 6 7 8 9 10次

最初の10のリンクを持つ方法を見つける:

xidel.exe https://www.website.es/search?q=xidel+follow+pagination^&start=0 --extract "//a/extract(@href, 'url[?]q=([^&]+)&', 1)[. != '']" 

が、私は

-f "<A class="fl">{.}</A>" 

または

--follow "//a/[@class='nav']" 

nothinkが仕事で2ページまたはページ(N)に従うことをしようとするとき、あなたは私にいくつかの助けや、いくつかの例を与えることができますか?

ありがとうございました。

答えて

1

Reinoが正しいです。しかし、Googleに問い合わせることもできます:

xidel -s "https://www.google.com"^
     -f "form(//form,{'q':'xidel follow pagination','num':'25'})"^
     -e "//a/extract(@href,'url\?q=(.+?)&',1)[.]" 
+0

ありがとう、完璧です。 – jhonitalia

2
xidel-0.9.5.4998.exe -s^
        "https://encrypted.google.com/search?q=xidel+follow+pagination&start=0"^
        -e "//a/extract(@href,'url\?q=(.+?)&',1)[.]"^
        -f "(//td/a/@href)[last()]"^
        -e "//a/extract(@href,'url\?q=(.+?)&',1)[.]" 

または

xidel-0.9.5.4998.exe -s --user-agent "Xidel"^
        "https://encrypted.google.com/search?q=xidel+follow+pagination&start=0"^
        -e "//h3[@class='r']/a/extract(@href,'=(.+?)&',1)"^
        -f "//td[@class='b']/a/@href"^
        -e "//h3[@class='r']/a/extract(@href,'=(.+?)&',1)" 

トリックを行うだろう。

+0

ありがとうございました... ... ... – jhonitalia

関連する問題