私がHTMLを解析するとき、私はドキュメント全体の最も内側のタグだけを取得したいと考えています。私の意図は、HTML文書からデータを意味的に解析することです。私はこのHTML解析 - 最も内側のHTMLタグを取得
<html>
<table>
<tr><td>X</td></tr>
<tr><td>Y</td></tr>
</table>
</html>
のような一部のHTMLを持っている場合
は、だから私は一人で<td>X</td>
と<td>Y</td>
たい。これは美しいスープやlxmlを使って可能ですか?
HTMLないXHTML - そう習慣作業ためなどうまく形成されません。 –
私はXPathが動作するはずのlxmlについて言及していました。 – Tomalak