0
サイトをクロールしようとしています。は、各アドレスにURLパラメータを追加する前に付加しています。Rubyのクロールサイト、URLパラメータを追加
require "spidr"
Spidr.site('http://www.example.com/') do |spider|
spider.every_url { |url| puts url }
end
しかし、私はそうのようなのparamをすべてのページにヒットして追加するクモをみたい:ここで私がこれまで持っているものだ
- example.com/page1?var=param1
- example.com/page2?var=param1
- example.com/page3?var=param1
UPDATE 1 - はしかし動作していない、これを試してみましたが、電子rrorsアウト(「許可されていない405の方法」)は、数回の反復の後:
require "spidr"
require "open-uri"
Spidr.site('http://example.com') do |spider|
spider.every_url do |url|
link= url+"?foo=bar"
response = open(link).read
end
end
URLの配列にパラメータを追加するだけです。試しましたか? –
それは私に起こったのですが、それで何ですか?適切にフォーマットされたURLの配列を作成したら、spidrを使ってそのURLを実行しますか? – mustacheMcGee
いいですね。それを試してください –