ここでは、スキャンしたいhtmlの抜粋を示します。string.scanを実行するときにmuliple行を許可する方法
<div class="text">
<h3>
<a href="http://www.faith.co.uk/">
Rodeo Sinclair
</a>
</h3>
ここに私のルビーコードがあります。
@doc = open(url) { |f|
@doc = f.read
}
output = @doc.scan(/<h3><a href=(.*?)>/)
これは、htmlファイルの新しい行と空白のために機能しません。とにかく私はこれを回避することができますか?
ありがとうございます、これはHTMLのパターンのすべてのインスタンスを取得しますか? – bolshevik
@bolshevik各ループに変更して、各一致するリンクのhrefを取得する方法を示しました – ironchefpython