BeautifulSoup4 Python 3.4掻き出しの問題

同じタグ名の情報がいくつかあるWebサイトからデータを取得しようとしています。例：BeautifulSoup4 Python 3.4掻き出しの問題

<td class=pizza>cheese </td> 
<td class=pizza> deluxe</td> 
<td class=pizza> pepperoni</td> 
<td class=pizza> raccoon</td> 
<td class=pizza> mushshroom</td> 
<td class=pizza> anchovy</td>

どのように私はチーズではないだろうものを選択する（BeautifulSoup 4を使用）、ウェブスクレイピングの行を記述します。（私はデラックスをしたいと言う）。あなたは、具体的cheeseをしたくない場合は、a functionを使用して、それをフィルタリングすることができます

pizza = soup.find("td", {"class": "pizza"}) 
print (pizza) #This will give me cheese as a result, and I want deluxe.

出典

2016-04-22 cparks10

：

soup.find("td", class_="pizza", text=lambda text: text and text.strip() != "cheese")

それとも、あなたは二tdをしたい場合には、の線に沿って何かではないでしょう要素がclass="pizza"の場合：

soup.find_all("td", class_="pizza")[1]

出典

2016-04-22 02:36:26 alecxe

驚くばかり！これはうまくいった！どうもありがとうございます！ – cparks10

BeautifulSoup4 Python 3.4掻き出しの問題

答えて

関連する問題