前にテキストを抽出するために:私はここにテキストCategory:
使用BeautifulSoupは、このHTMLソースからの最初の子タグ
を抽出したい
<div class="category_link">
Category:
<a href="/category/personal">Personal</a>
</div>
はコメントとして出力でのPython/BeautifulSoupを(使用して私の試みです - 〜の後)#
parsed = BeautifulSoup(sample_html)
parsed_div = parsed.findAll('div')[0]
parsed_div.firstText() # <a href="/category/personal">Personal</a>
parsed_div.first() # <a href="/category/personal">Personal</a>
parsed_div.findAll()[0] # <a href="/category/personal">Personal</a>
私は "テキストノード"を最初の子として利用できると考えています。どのように私はこれを解決することができます上の任意の提案?
'parsed_div.contents [0]' – Avaris