2017-08-20 10 views
1

を抽出するために、リストにBeautifulSoupオブジェクトを変換する「bs4.BeautifulSoup」私はクラスに属する次のHTML出力を取得するPythonコードの次の2行からデータ

私は、リストせるにそれを行うことができますどのように
site_link = soup.find_all('a', string='Aberdeen')[0] 
row = site_link.findParent('td').findParent('tr').findAll('td') 

<html><body><p>[</p><td><a href="../networks/site-info?site_id=ABD">Aberdeen</a><br/> 
<a class="smalltext" href="https://uk-air.defra.gov.uk/assets/graphs/ABD_weekly_m.png">Timeseries Graph</a></td>, 
<td class="center"><span class="bg_low2 bold">48 (2 Low)</span></td>, 
<td class="center"><span class="bg_low1 bold">4 (1 Low)</span></td>, 
<td class="center"><span title="Not Measured">n/m</span></td>, 
<td class="center"><span class="bg_low1 bold">2 (1 Low)</span></td>, 
<td class="center"><span class="bg_low1 bold">6 (1 Low) 
</span> 
</td>, 
<td>19/08/2017<br/>17:00:00</td>]</body></html> 

私はアイテムを抽出することができますので、例えば私のリストが呼び出されマイリスト:

>>>print(mylist[1].text) 
48 (2 Low) 
+0

はい、私は、それが今で考え出し感謝を持っている – Paulos

答えて

1

あなたはtag.find_allを探しています:

mylist = soup.find_all('span', class_='bg_low2 bold') 

は今、mylistは、すべてのspanのタグが含まれている、とあなたはspanのデータのi番目にアクセスすることができますmylist[i].textと。

+0

おかげで、どのように私はすべての項目/要素にアクセスすることができますが、例えば_class = 'bg_low2 bold'を持たない時間(最後の要素) – Paulos

+1

@Paulos 'soup.find_all( 'span')' –

+1

'class_'は' _class'ではありません... –

関連する問題