2017-08-29 14 views
-1

私は次のウェブサイトのURLを検索しています。しかし、私はコンテンツのほんの一部を戻すだけです。BeautifulSoupを使用してウェブサイトの検索エンジンを掻く

from urllib.request import urlopen as uReq 
from bs4 import BeautifulSoup 
my_url = 'https://www.kvk.nl/zoeken/#!zoeken&q=ING&index=4&site=kvk2014&start=0' 
uClient = uReq(my_url) 
page_html = uClient.read() 
uClient.close() 

# Data pull 
page_soup = BeautifulSoup(page_html, "html.parser") 

page_soupmy_urlページで入手可能な情報のhrefのラインのカップル、およびNoneを返します。私はそのウェブページの最初の検索結果に本当に興味があります。その会社の完全な名前:ING Bank N.V.とその会社の残りの情報

+1

私たちは、あなたが何を得るのか、何を期待しているのか、何が欠けているのかを見ることはできません。詳細を教えてください。 – cezar

+0

詳細をご覧ください – maestromusica

+0

ウェブサイトには、page_soupオブジェクトの美しいスープでは取り上げられていない検索フィールドの情報があります。上記のコードを実行するだけで、違いは即座に得られます。 –

答えて

0

本当のコンテンツは、JSファイルの中に隠されている、のような:

https://zoeken.kvk.nl/search.ashx?callback=jQuery1124043501887376358495_1504000357055&q=ING&index=4&site=kvk2014&start=20&_=1504000357058 

あなたはすべてのHTTPリクエストをチェックするためにクロムデバッグモードを使用して、実際のデータを得なければなりません。

関連する問題