0
私はbs4にかなり初心者です。私は価格表を抽出することを楽しみにしています。divs要素のテーブルをbeautifulsoupで抽出しようとしています
私が直面している主な問題は、htmlページでは表要素がそのまま表示されないことですが、div
です。 class
、id
で検索しようとしましたが、価格を入手できません。
これは私がしようとしたものです。ここで
url = "http://www.valoreazioni.com/indici/ftse-mib_ftsemib_mi"
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data,"html5lib")
は私が失敗した
# table=soup.find('div',{'id':'maidMoneyTable'})
# table=soup.find(id='maidMoneyTable')
route=pd.read_html(str(tables),flavor='html5lib')
print(route)
どちらの場合も、リターンがno tables were found
ある価格 のテーブルを取得するために適用したフィルタであり、
どのようにして希望のテーブルを取得できますか?
'html5lib'の代わりに' lxml'パーサーを試してみてください。 –
もう一つの理由は、テーブルが 'Javascript'によって動的に読み込まれるということです。その場合は 'selenium'を使う必要があります。'要求 'は' Javascript'レンダリングされたページを扱うことができません。 –