3
<tr id="inmate_201700220865">
<td class="row ">3</td>
<td class="row "><a href="javascript:" onclick="getInmatePreview(201700220865)">View</a>
<input type="hidden" id="bookingPhoto_201700220865" value="http://bookings.example.org/201708/20170826.AA8">
<input type="hidden" id="bookingPhotoFile_201700220865" value="20170826.AA8">
<input type="hidden" id="bookingPhotoFolder_201700220865" value="201708">
<input type="hidden" id="bookingPhotoName_201700220865" value="LAST, FIRST LAST">
<input type="hidden" id="inmateID_201700220865" value="277497">
<input type="hidden" id="index_2" value="201700220865">
<input type="hidden" id="curIndex_201700220865" value="2"></td>
<td class="row ">LAST<input type="hidden" id="bookingLastName_201700220865" value="LAST"></td>
<td class="row ">FIRST<input type="hidden" id="bookingFirstName_201700220865" value="FIRST"></td>
<td class="row ">LAST<input type="hidden" id="bookingLastName_201700220865" value="LAST"></td>
<td class="row ">08/26/2017</td>
<td class="row ">41</td>
<td class="row ">M</td>
</tr>
この表から最後の6行のテキストを削り取りようとしています。私は美しいスープを通してネストループを実行することなく、困難を抱えています。私は簡単な方法があると確信していますが、記録のためには、姓、名、姓、年齢、性別の最後の3行が必要です。以下は、tr
全体を返す私のコードです。事前に特定のテキストのネストされたWebページを掻き集める
from bs4 import BeautifulSoup
from urllib.request import urlopen
import re
#beautiful soup scrape
scraped = urlopen('http://www.example.org/inmates/').read()
soup = BeautifulSoup(scraped, 'html.parser')
for item in soup.find_all('tr',{'id' : re.compile('^inmate') }):
for name in item ('td',{'class' : "row alt"}):
print (item)
おかげ
私はこのようにチェックしていないが、私はそれがうまくいくと確信している。ありがとうございました。 – Lyrics