2012-02-21 17 views
2

このHTMLコードをNokogiriと解析する必要がありますが、「Piso en Calle Antonio Pascual」を別の変数に、「Peñiscola」を別の変数に保存してください。Nokogiriを使用してHTMLから複数の文字列を解析するにはどうすればよいですか?

<h1 class="title g13_24"> 
     Piso en Calle Antonio Pascual 
     <span class="title-extra-info">Peñíscola</span> 
</h1> 
+0

[回答を受け入れる]ことを忘れないでください。(http://meta.stackexchange.com/a/5235/176476) –

答えて

0
require 'nokogiri' 
doc = Nokogiri::HTML.parse(<<-HTML) 
    <h1 class="title g13_24"> 
    Piso en Calle Antonio Pascual 
    <span class="title-extra-info">Peñíscola</span> 
    </h1> 
HTML 

h1 = doc.at_css('h1.title') 
str1 = h1.children[0].text.strip 
# => "Piso en Calle Antonio Pascual" 
str2 = h1.at_css('.title-extra-info').text.strip 
# => "Peñíscola" 

しかし率直に言って、鋸山のドキュメントはあなたに同じことを言われただろう。

+0

レコードの場合、フォーマットを追加するとこれが中断されます。メソッドは影響を受けません。 – pguardiario

+0

@pguardiario:どのような変更が必要ですか? –

+0

太字、イタリック、アンカーなど、最初の行に小さな変化がある場合は、それらを生き残りたい場合は、私のやり方をしなければなりません。そしてそれは冗談ではありません:P – pguardiario

関連する問題