BeautifulSoupを使用してウェブサイトの検索エンジンを掻く

-1

私は次のウェブサイトのURLを検索しています。しかし、私はコンテンツのほんの一部を戻すだけです。BeautifulSoupを使用してウェブサイトの検索エンジンを掻く

from urllib.request import urlopen as uReq 
from bs4 import BeautifulSoup 
my_url = 'https://www.kvk.nl/zoeken/#!zoeken&q=ING&index=4&site=kvk2014&start=0' 
uClient = uReq(my_url) 
page_html = uClient.read() 
uClient.close() 

# Data pull 
page_soup = BeautifulSoup(page_html, "html.parser")

page_soupはmy_urlページで入手可能な情報のhrefのラインのカップル、およびNoneを返します。私はそのウェブページの最初の検索結果に本当に興味があります。その会社の完全な名前：ING Bank N.V.とその会社の残りの情報

出典

2017-08-29 Melly Donald

私たちは、あなたが何を得るのか、何を期待しているのか、何が欠けているのかを見ることはできません。詳細を教えてください。 – cezar

詳細をご覧ください – maestromusica

ウェブサイトには、page_soupオブジェクトの美しいスープでは取り上げられていない検索フィールドの情報があります。上記のコードを実行するだけで、違いは即座に得られます。 –

本当のコンテンツは、JSファイルの中に隠されている、のような：

https://zoeken.kvk.nl/search.ashx?callback=jQuery1124043501887376358495_1504000357055&q=ING&index=4&site=kvk2014&start=20&_=1504000357058

あなたはすべてのHTTPリクエストをチェックするためにクロムデバッグモードを使用して、実際のデータを得なければなりません。

出典

2017-08-29 09:54:38 Howardyan

BeautifulSoupを使用してウェブサイトの検索エンジンを掻く

答えて

関連する問題