私はこのpageから以下のhtmlを持っています。xpathの後続兄弟とテーブル内の要素のグループ化
<tbody><tr>
<td align="center" class="column_heading" width="200" title="The following are the Endorsements for the above license.">Endorsements</td><td align="center" class="column_heading" width="150" title="See Authorization Level Codes with their description at the bottom of the page.">Authorization Level(s) *</td></tr>
<tr><td align="center" bgcolor="#8AFF8A" class="section_detail">Health Education</td>
<td align="center" bgcolor="#FFFFCC" class="section_detail">HS</td></tr><tr><td align="center" bgcolor="#8AFF8A" class="section_detail">Physical Education</td>
<td align="center" bgcolor="#FFFFCC" class="section_detail">ML/HS
</td></tr></tbody>
<tbody><tr>
<td align="center" class="column_heading" width="200" title="The following are the Endorsements for the above license.">Endorsements</td><td align="center" class="column_heading" width="150" title="See Authorization Level Codes with their description at the bottom of the page.">Authorization Level(s) *</td></tr>
<tr><td align="center" bgcolor="#8AFF8A" class="section_detail">School Counselor</td>
<td align="center" bgcolor="#FFFFCC" class="section_detail">ML/HS C
</td></tr></tbody>
私はすべて一緒に圧縮し、第二のテーブルからそれを区別することができ、リストに最初Endorsements
とAuthorizations
下の情報を載せていきたいと思います。
リストでは、次のようになります。 ['Health Education', 'HS', Physical Education', 'ML/HS\r'], ['School Counselor', 'ML/HS C\r']
。
私が今取得しているのは、 ['Health Education', 'HS'], ['Physical Education', 'ML/HS\r'], ['School Counselor', 'ML/HS C\r']
です。
私のコードの短いバージョンは次のとおりです。どこへ行く
test2 = tree.xpath(".//tr[td = 'Endorsements']/following-sibling::tr")
endorse1.append(test2)