ルビーを使っていくつかのウェブサイトを削り取り、宝石を機械化したい

-4

私はページネーションを含むいくつかのウェブサイトを掻きたい。例http://somesite.com/page/ルビーを使っていくつかのウェブサイトを削り取り、宝石を機械化したい

ため

私は、各ページネーションに各ポストをこすりたいです。

ページ/ 1には、約5つの投稿があります。

どのように各ページ内の各データをこすりますか？最後のページまで？ここ

私は検索と研究しました、と私は2同様の質問を見つけましたが、イムはまだそれを混同...

first way

second way

どのように任意のアイデアそれを組み合わせる？あなたが宝石を機械に使用するを持っている

出典

2017-02-01 Cedric Cikho

[あなたがこの記事を読むことができます]（http://ruby.bastardsbook.com/chapters/web-crawling/） –

前

おかげ？ Nokogiriを使用することを強くお勧めします。それは非常に簡単で使いやすいです。

ページが見つからないときにページを取得して停止するループを作成することができます。

require 'open-uri' 
require 'nokogiri' 
pages_count = 1 
loop do 
    @html = Nokogiri::HTML(open("somepage.com/#{pages_count}")) 
    ... 
    pages_count = pages_count + 1 
end

出典

2017-02-01 10:32:05

は、あなたがそれについて私を助けることができますか？ –

どうすれば教えてあげますか？ –

私は解決策を見つけるのを手助けします.. –

ルビーを使っていくつかのウェブサイトを削り取り、宝石を機械化したい

答えて

関連する問題