ウェブサイトからすべての画像ファイルを保存する

私はRubyスクリプトを実行して自分のブログからすべての画像を保存する小さなアプリを作成しています。ウェブサイトからすべての画像ファイルを保存する

イメージファイルを特定した後にイメージファイルを保存する方法がわかりません。どんな助けでも大歓迎です。

require 'rubygems' 
require 'nokogiri' 
require 'open-uri' 

url = '[my blog url]' 
doc = Nokogiri::HTML(open(url)) 

doc.css("img").each do |item| 
    #something 
end

出典

2011-10-28 Zack Shapiro

これは本当にレールに関連していますか？ –

URL = '[my blog url]' 

require 'nokogiri' # gem install nokogiri 
require 'open-uri' # already part of your ruby install 

Nokogiri::HTML(open(URL)).xpath("//img/@src").each do |src| 
    uri = URI.join(URL, src).to_s # make absolute uri 
    File.open(File.basename(uri),'wb'){ |f| f.write(open(uri).read) } 
end

ここから絶対パスに変換するコードを使用する：：How can I get the absolute URL when extracting links using Nokogiri?

出典

2011-10-28 18:57:14 Phrogz

これを使用するとエラーが発生します。 "コンバイルエラー、バイト0xFF 0xC3 0x98 0xC3"のために出力変換に失敗しました " – Farhad

-1

system %x{ wget #{item['src']} }

編集：鋸山からのimg srcをつかむために更新されたコード：これは、あなたがwgetの:) 編集2とUNIXシステムにしていると仮定しています。

if item['src'] =~ /([^\/]+)$/ 
    File.open($1, 'wb') {|f| f.write(open(item['src']).read)} 
end

出典

2011-10-28 08:17:27

これは、相対イメージパスを処理しません。 – Phrogz

Scrapifierの宝石を使ってページの頭や身体から画像を取得する方法。クールなのは、返すイメージのタイプ（jpg、png、gif）を定義することもできるということです。

はそれを試してみる：https://github.com/tiagopog/scrapifier

はあなたがお楽しみください。

出典

2011-10-28 09:39:33 pguardiario

/（^ \ /] +）$/meanとは何ですか？ –

@ZackShapiroこれは、 "スラッシュではなく、文字列の最後に触れる限り、1つ以上の文字と一致する正規表現です。この場合、@ pguardiarioはそれを使ってファイル名を取得します。そのため、 '$ 1'を使ってその名前のファイルを保存することができます。これは私の答えの 'File.basename（uri）'部分の奇妙な形です。 – Phrogz

ヒント：シンプルがあるのかもしれないようなものは、src属性は絶対URLであると仮定し

出典

2014-04-09 15:05:38

ウェブサイトからすべての画像ファイルを保存する

答えて

関連する問題