私は、このページからメインテーブルからデータを取得しようとしていますと、超シンプルなスクレイピング: https://www.interactivebrokers.com/en/index.php?f=2222&exch=globex&showcategories=FUTGRP#productbufferパイソン - 要求とBS4
私が試した:
import requests
from bs4 import BeautifulSoup
address="https://www.interactivebrokers.com/en/index.php?f=2222&exch=globex&showcategories=FUTGRP#productbuffer"
r=requests.get(address)
soup=(r.text,"html_parser")
は、私が知っている、これは超基本であるが、どういうわけか私はここでブロックされています。
私はsoup.find_all('table')
を試しましたが、私が探しているテーブルを正しく識別できませんでした(IDまたは識別可能な属性がないようです)。
私はsoup.find_all('tr')
を試しましたが、私は探している行を見ることができますが、分離する方法がわからない結果にいくつかの望ましくない行があります。
誰もがbs4で私の最初のステップを助けることができますか?
必要な表と取得する行を指定します。 –
または私達は推測できる.... –
私はヘッダー "IBシンボル、製品の説明、シンボル、通貨"とテーブルを探しています。私はあなたがsoup = BeautifulSoup(r.text、 "html.parser")... –