私はこのHTMLからいくつかのデータを掘るしようとしている、
HTMLが別のスパン(Seems like valid html according to other stack over flow post)jsoupスパン
そう表現
td > p > span
リターン内のスパンを持っています2要素(2番目の要素には両方のスパンがあります)
これには方法がありますか?この例では
<td width="414" style="width:310.25pt;border:none;border-bottom:solid #AEAAAA 1.0pt;padding:0in 5.4pt 0in 5.4pt;height:.3in">
<p class="MsoNormal" style="margin-bottom:0in;margin-bottom:.0001pt;line-height:normal">
<span style="font-size:8.0pt;font-family:"Arial",sans-serif;color:black">03/</span>
<span style="font-size:8.0pt;font-family:"Arial",sans-serif">26<span style="color:black">/17</span>
</span>
<o:p/>
</p>
</td>
コード:
protected String getSimpleValue(org.jsoup.nodes.Document doc,String selector) {
StringBuffer buff = new StringBuffer();
try {
Elements result = doc.select(selector);
for (Element element : result) {
buff.append(element.ownText()+" ");
}
}catch(Exception ex) {
ex.printStackTrace();
}
return buff.toString();
}
あなたの質問は何ですか?あなたは何を期待して何を得るのですか? – luksch