Regex検索製品名と価格を取得

-2

私は製品名のリストを持っており、私は次のURLで製品名を検索したいと私は価格を取得する必要があります。私は成功し、一致を得た場合、その後どのように私は、スクレーピングによって価格すなわち€8.49 を得ることができます http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps このURLに - は、例えばi「は1×50パックTommee Tippee使い捨て母乳パッド」を検索したいです。このデモのURLのひとつでも同様に、私はURLをRegex検索製品名と価格を取得

のリストを持っている

出典

2017-05-26 Adeel Nazir

StackOverflowのは、フリーコードサービスではありません。あなたが試したこととあなたのコードのどこにあなたが立ち往生したかを示してください。そしてその特定の問題にあなたの質問を指示してください。 –

また、ウェブサイトへのリンクではなく、データの抽出を投稿することをお勧めします。あなたはたぶん良い意図でウェブサイトをリンクしていましたが、それは広告やマルウェアの伝播のために悪用される可能性があります。 – Aaron

に私はこの仕事をするために、任意の例や正規表現を提供するために、いくつかのサンプルコードを助けてくださいあなたは、このプロジェクトのキックオフに役立つかもしれません。

import re 
from bs4 import BeautifulSoup 

url = 'http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps' 
soup = BeautifulSoup(url, 'html.parser') 
product_name_regex = 'Tommee Tippee Disposable Breast Pads - 1 x 50 Pack' 
product_tag = soup.find('div', text=re.compile(product_name_regex)) 
price_tag = product_tag.find_next('div', { "class" : "product_price" }) 
price = price_tag.text

この短いコードは、最初のHTMLページを解析し、テキスト/クラス名を使用してタグを見つけて、そのページから情報を抽出しようとしています。

あなたを助けるかもしれないいくつかのリンク： BeautifulSoup Doc 、 How to find elements by class

出典

2017-05-26 13:02:04 Flames

こんにちは@Flames これは正解です。私はこのlibはPython用だと思いますが、私はC＃で必要です。 c＃またはJavaスクリプトで利用できるlibがありますか？ –

HtmlAgilityPackのIdea Got Solutionをお寄せいただきありがとうございます –

@AdeelNazir問題ありません。 – Flames

Regex検索製品名と価格を取得

答えて

関連する問題