nokogiriを使用してウェブサイトを削っています。この特定のウェブサイトは絶対URLを別々に扱います。何が起こるかというと、私はこのruby nokogiri htmlページから現在のURLを取得
page = Nokogiri::HTML(open(link, :allow_redirections => :all))
のようにそれにURLを与え、それがhttps
バージョンにリダイレクトされます、そして、それはまた、URLの長いバージョンにリダイレクトされますです。例えば、
のようなリンクが
http://www.website.com/other-area/name
になり、これは素晴らしいですし、本当に私のスクレーパーには影響を与えません。しかし、私がスクレーパーに現在のURLを伝えることができれば、私はそれを避けることができます。
私の質問は、上記のリンクをpage
変数に渡した後、リダイレクトが発生した後にそのページの現在のURLを取得する方法はありますか?
感謝を!私はこれを実際にやろうとしていましたが、私はそのことだけを機械化することを望まないので、上記の答えに(open-uriを使って)行くことにしました。 –