に私はこの仕事をするために、任意の例や正規表現を提供するために、いくつかのサンプルコードを助けてくださいあなたは、このプロジェクトのキックオフに役立つかもしれません。
import re
from bs4 import BeautifulSoup
url = 'http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps'
soup = BeautifulSoup(url, 'html.parser')
product_name_regex = 'Tommee Tippee Disposable Breast Pads - 1 x 50 Pack'
product_tag = soup.find('div', text=re.compile(product_name_regex))
price_tag = product_tag.find_next('div', { "class" : "product_price" })
price = price_tag.text
この短いコードは、最初のHTMLページを解析し、テキスト/クラス名を使用してタグを見つけて、そのページから情報を抽出しようとしています。
あなたを助けるかもしれないいくつかのリンク: BeautifulSoup Doc 、 How to find elements by class
StackOverflowのは、フリーコードサービスではありません。あなたが試したこととあなたのコードのどこにあなたが立ち往生したかを示してください。そしてその特定の問題にあなたの質問を指示してください。 –
また、ウェブサイトへのリンクではなく、データの抽出を投稿することをお勧めします。あなたはたぶん良い意図でウェブサイトをリンクしていましたが、それは広告やマルウェアの伝播のために悪用される可能性があります。 – Aaron