Beautifulsoupです。これはPythonのhtml解析に便利です。Beautifulsoupは属性 "class"のリストを返しますが、他の属性の値は
from bs4 import BeautifulSoup
tr ="""
<table>
<tr class="passed" id="row1"><td>t1</td></tr>
<tr class="failed" id="row2"><td>t2</td></tr>
</table>
"""
table = BeautifulSoup(tr,"html.parser")
for row in table.findAll("tr"):
print row["class"]
print row["id"]
結果:
[u'passed']
row1
[u'failed']
row2
なぜ属性配列としてclass
リターン? id
は正常値ですか?
beautifulsoup4-4.5.0
はpython 2.7
感謝:
は、この例を考えてみましょう –