私はスキャンしているHTMLの例です。Nokogiriでパターンの複数のインスタンスを取得するにはどうすればよいですか?
<div class="text">
<h3>
<a href="http://www.faith.co.uk/">
Rodeo Sinclair
</a>
</h3>
.
.
.
h3>
<a href="http://www.hate.co.uk/">
Morvern
</a>
</h3>
ここに私のコードです。
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open(url))
output = doc.css('div h3 a').attr("href")
問題は、最初のURLのみを出力することです。私は両方をどうやって得るのですか?
パターンの複数のインスタンス(あなたのケースでは 'div h3 a')が存在する場合、' css'は反復処理が可能な 'NodeSet'を返さなければなりません。 – itdoesntwork