2017-07-12 3 views
0

私はこのウェブページの特定の値にアクセスするのに少し問題があります(これは古いものを売っているフランスのウェブサイトです)。 私はそこにある特定のアイテムの訪問回数を取得しようとしています。 83 visites(それはフランス語で「Visites」を書かれている画面の真ん中)があることをbeautifulSoupで何かにアクセスできない

from bs4 import BeautifulSoup 
import lxml 
import requests 
from fake_useragent import UserAgent 


ua = UserAgent() 
header = {'user-agent' : ua.chrome} 
kjj_page = requests.get("http://www.kijiji.ca/v-velo-de-route/laval-rive-nord/velo-de-route-time/1280774723", headers=header) 


soup = BeautifulSoup(kjj_page.content, 'lxml')  # This take two parameters, the file we want to parse and 
                # the parser 

content = soup.findAll("span", {"class" : "ad-visits"}) 
print(content) 

問題は、ウェブサイト上であなたが見ることができますされています。とにかく、ここでhttp://www.kijiji.ca/v-velo-de-route/laval-rive-nord/velo-de-route-time/1280774723

私のコードです:ここのリンクですしかし、私のコンソール上で私はその番号を見ることができません...なぜですか?どうすれば入手できますか?

答えて

0

は、このセレクタを試してみてください:

content = soup.findAll("span", "ad-visits") 

そのウェブサイトを開いている間より多くの例は、あなたがクロームDevelperツール(または類似)のオープンを持っている場合、あなたはそれがtheresの参照してくださいよ、documentation page

1

にあります。 XHRこの住所に電話するhttp://www.kijiji.ca/j-vac-inc-get.json

ページIDをGETパラメータとして渡すと、訪問数が表示されます。訪問の現在の数を出力

import requests 
from fake_useragent import UserAgent 

URL = "http://www.kijiji.ca/v-velo-de-route/laval-rive-nord/velo-de-route-time/1280774723" 
URL_ID = URL.split('/')[-1] 

ua = UserAgent() 
header = {'user-agent' : ua.chrome} 
kjj_page = requests.get("http://www.kijiji.ca/j-vac-inc-get.json?adId=%s" % URL_ID, headers=header) 

print (kjj_page.json()["numVisits"]) 

:ここ は、そのページの一例である

+0

ねえ戦車あなたの答えのために多くのことを、残念ながら、私はほとんどドンあなたが話していることをわかりません。 XHRコールとは何ですか?あなたが選んだ住所はどこから来たのですか?あなたが言及しているすべてのものを私に説明できるチュートリアルがありますか?ありがとう、パル! – spmegaman

関連する問題