2016-04-22 32 views
2

同じタグ名の情報がいくつかあるWebサイトからデータを取得しようとしています。 例:BeautifulSoup4 Python 3.4掻き出しの問題

<td class=pizza>cheese </td> 
<td class=pizza> deluxe</td> 
<td class=pizza> pepperoni</td> 
<td class=pizza> raccoon</td> 
<td class=pizza> mushshroom</td> 
<td class=pizza> anchovy</td> 

どのように私はチーズではないだろうものを選択する(BeautifulSoup 4を使用)、ウェブスクレイピングの行を記述します。 (私はデラックスをしたいと言う)。あなたは、具体的cheeseをしたくない場合は、a functionを使用して、それをフィルタリングすることができます

pizza = soup.find("td", {"class": "pizza"}) 
print (pizza) #This will give me cheese as a result, and I want deluxe. 

答えて

3

soup.find("td", class_="pizza", text=lambda text: text and text.strip() != "cheese") 

それとも、あなたは二tdをしたい場合には、の線に沿って何かではないでしょう要素がclass="pizza"の場合:

soup.find_all("td", class_="pizza")[1] 
+0

驚くばかり!これはうまくいった!どうもありがとうございます! – cparks10

関連する問題