2017-10-23 4 views
1

私はこのサイトを掻き回そうとしています:http://stcw.marina.gov.ph/find/?c_n=14-111112&opt=stcwそして、テーブルを一番下に置いてください。私がそれをかき集めようとすると、最初の行のいくつかの要素が得られますが、テーブルの残りの要素はありません。python bs4スクレイプテーブルが間違った結果になる

22-20353 

           SHIP SECURITY OFFICER 

全体ではなく、テーブル:ここに出力されているように私は何を得る私のコード

urlText = "http://stcw.marina.gov.ph/find/?c_n=14-111112&opt=stcw" 
url = urlopen(urlText) 
soup = bs.BeautifulSoup(url,"html.parser") 
certificates = soup.find('table',class_='table table-bordered') 
for row in certificates.find_all('tr'): 
    for td in row.find_all('td'): 
     print td.text 

です。 私は何が欠けていますか?

答えて

1

underlying parser makes a differenceの場合のさらに別のケースです。 またはhtml5libに切り替えて、解析された完全な表を表示します。

soup = bs.BeautifulSoup(url, "lxml") 
soup = bs.BeautifulSoup(url, "html5lib")