0
子供を反復処理:lxmlのパイソン - タグを抽出して、私は次のようにタグを取得するためにlxmlのを使用しています
el = doc.get_element_by_id('productDescription')
私の理解el
からは、ちょうどそのタグとその子が含まれています。
el.iterdescendants()
を使用すると、私が抽出しているメインタグの外側にタグが表示されます。
これはどのように可能ですか? (これはamazon.comなので、DOMは良いです)。
el = doc.get_element_by_id('productDescription')
for j in el.iterdescendants():
print j.tag
子孫で、タグや作業のみを抽出する適切な方法は何ですか?
XMLのスニペットがありますか? –
CSSSelector(lxml.cssselect import CSSSelector)を使用しても結果は異なりますか? –
入力と出力を表示するといいでしょう。すべてが正しいように見えます(あなただけが子孫ではなく子孫を反復したい場合) – newtover