2017-06-28 8 views
2

私はこのHTMLコードを有する:Beautifulsoup:どうすれば次の<p.text>を解析できますか?

<div class="card big_card"> 
<h3><a href=""></a></h3> 
<div class="clogo"> 
<img src=""><span class="site"><a href="" target="_blank"                title=""></a></span> 
</div><p>telephone</b></p> 
<p>address</p> 
</div>   

を、私はbeautifulsoupでこれを符号化:

soup = BeautifulSoup(page.text, 'lxml') 
for prov in soup.find_all('div', class_="card"): 
try: 
cur.execute("INSERT INTO provs (name,site,tel,address) VALUES (%s,%s,%s,%s)", (prov.a.get_text(),prov.p.get_text(),prov.b.get_text(),)) 
print prov.get_text() 

最初の "P" タグが解析され、私は第二の "P" タグを解析できません住所付き。

次の「p」タグと最初のタグを解析するにはどうすればよいですか?

ありがとうございました!

答えて

0
cur.execute("INSERT INTO provs (name,site,tel,address) VALUES (%s,%s,%s,%s)", (prov.a.get_text(),prov.p.get_text(),prov.b.get_text(),prov.find_all('p')[-1].get_text(),)) 

正解!

関連する問題