2016-05-18 12 views
-1

正規表現の使い方は本当にわかりませんし、大量のイメージダウンローダを使用して、1〜20ページ目のページを見つけてクロールをリンクする必要があります。特定のフォーラム用の正規表現

これはURLである:そのページ(stのparam)は25に増加され

/index.php?app=core&module=search&do=viewNewContent&period=month&userMode=&search_app=forums&sid=ceb2a9ba4039e4a06d3a6775aa735f2d&search_app_filters[forums][searchInKey]=&st=400 

ので、以下のページには、次のようになります。

/index.php?app=core&module=search&do=viewNewContent&period=month&userMode=&search_app=forums&sid=ceb2a9ba4039e4a06d3a6775aa735f2d&search_app_filters[forums][searchInKey]=&st=425 

どのように私は、ページに合わせて交換することができます次の連続したページ番号の番号?

答えて

0

あなたは25であることをインクリメントするあなたが書いているものは何でも、言語、最後の桁と使用をキャプチャすることができます。

/(\/index\.php.+?)(\d+)$/ 

これは、[あなたの$ 1 URLと$ 2または試合でページ番号を与えます2](但し、選択した言語が最初の "キャプチャ"を表します)。これで、それを増やすことができます。 URLのこの形式のためにそれを行う必要があります

matches = url.match(/(\/index\.php.+?)(\d+)$/) 
page = matches[2].to_i    # Convert the page number to integer 
page = page + 25      # Calculate the new page number 
new_url = matches[1] + (page).to_s # Merge in the new page number 

このRubyの例では、それを行います。

関連する問題