私はflipkart.comを掻き集めようとしました(60の製品を表示するカテゴリをランダムに開きました)。1ページに記載された製品情報のためのecommウェブサイトを掻き立てる
ただし、すべてのリンクを検索したときにBeautifulSoup
を使用すると、各商品を指し示すリンクが表示されませんでした。私は37のリンクを得ていませんでしたが、いずれも製品の説明ページを指していませんでした....
import requests
from bs4 import BeautifulSoup
# a random product listing page
url='https://www.flipkart.com/search?q=mobile&sid=tyy/4io&as=on&as-show=on&otracker=start&as-pos=1_1_ic_mobile'
r=requests.get(url)
soup=BeautifulSoup(r.text,from_encoding="utf-8")
links=soup.find_all('a')
リンクtoproduct descrtiption
ページ以外のすべてのリンクを指定しました。
返される最初のURLに 'data-reactid'が返されます –