2017-02-01 8 views
-4

私はページネーションを含むいくつかのウェブサイトを掻きたい。例http://somesite.com/page/ルビーを使っていくつかのウェブサイトを削り取り、宝石を機械化したい

ため

私は、各ページネーションに各ポストをこすりたいです。

ページ/ 1には、約5つの投稿があります。

どのように各ページ内の各データをこすりますか?最後のページまで?ここ

私は検索と研究しました、と私は2同様の質問を見つけましたが、イムはまだそれを混同...

>>

first way

second way

どのように任意のアイデアそれを組み合わせる?あなたが宝石を機械に使用するを持っている

+2

[あなたがこの記事を読むことができます](http://ruby.bastardsbook.com/chapters/web-crawling/) –

答えて

0

おかげ? Nokogiriを使用することを強くお勧めします。それは非常に簡単で使いやすいです。

ページが見つからないときにページを取得して停止するループを作成することができます。

require 'open-uri' 
require 'nokogiri' 
pages_count = 1 
loop do 
    @html = Nokogiri::HTML(open("somepage.com/#{pages_count}")) 
    ... 
    pages_count = pages_count + 1 
end 
+0

は、あなたがそれについて私を助けることができますか? –

+0

どうすれば教えてあげますか? –

+0

私は解決策を見つけるのを手助けします.. –

関連する問題