1
<tr id="section_1asd8aa" class="main">
<td class="header">
<table cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td style="font-family: arial,sans-serif; font-size: 11px;>DUMMY TEXT<a href="#">browser.</a>
</td>
</tr>
</tbody>
</table>
</td></tr>
上記はサンプルのhtmlです。私はhtmlファイルからすべてのクラス名を抽出したいと思います。 出力: '{"c1": "main"、 "c2": "header"}'BeautifulSoupを使ってHTMLファイルからすべてのクラス名を抽出する方法はありますか?
あなたはこれまで何をしていますか? –
ここで 'c1'、' c2'とは何ですか?彼らは重要ですか? – Psidom
@AzatIbrakovこれまではHTMLを読むことができましたが、各HTMLタグを取得できますが、それは私が見ているものではありません。 –