2017-05-26 15 views
-2

私は製品名のリストを持っており、私は次のURLで製品名を検索したいと私は価格を取得する必要があります。私は成功し、一致を得た場合、その後どのように私は、スクレーピングによって価格すなわち€8.49 を得ることができます http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps このURLに - は、例えばi「は1×50パックTommee Tippee使い捨て母乳パッド」を検索したいです。 このデモのURLのひとつでも同様に、私はURLをRegex検索製品名と価格を取得

のリストを持っている

+1

StackOverflowのは、フリーコードサービスではありません。あなたが試したこととあなたのコードのどこにあなたが立ち往生したかを示してください。そしてその特定の問題にあなたの質問を指示してください。 –

+2

また、ウェブサイトへのリンクではなく、データの抽出を投稿することをお勧めします。あなたはたぶん良い意図でウェブサイトをリンクしていましたが、それは広告やマルウェアの伝播のために悪用される可能性があります。 – Aaron

答えて

0

に私はこの仕事をするために、任意の例や正規表現を提供するために、いくつかのサンプルコードを助けてくださいあなたは、このプロジェクトのキックオフに役立つかもしれません。

import re 
from bs4 import BeautifulSoup 

url = 'http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps' 
soup = BeautifulSoup(url, 'html.parser') 
product_name_regex = 'Tommee Tippee Disposable Breast Pads - 1 x 50 Pack' 
product_tag = soup.find('div', text=re.compile(product_name_regex)) 
price_tag = product_tag.find_next('div', { "class" : "product_price" }) 
price = price_tag.text 

この短いコードは、最初のHTMLページを解析し、テキスト/クラス名を使用してタグを見つけて、そのページから情報を抽出しようとしています。

あなたを助けるかもしれないいくつかのリンク: BeautifulSoup DocHow to find elements by class

+0

こんにちは@Flames これは正解です。私はこのlibはPython用だと思いますが、私はC#で必要です。 c#またはJavaスクリプトで利用できるlibがありますか? –

+0

HtmlAgilityPackのIdea Got Solutionをお寄せいただきありがとうございます –

+0

@AdeelNazir問題ありません。 – Flames

関連する問題