0
私は美しいスープを使ってウェブサイトからデータを抽出して、HTMLを解析しようとしています。私は現在、以下のWebページからテーブルデータを取得しようとしている:私は、テーブルからデータを取得したい美しいスープにいくつかのHTMLテーブルタグがありません
。
soup = BeautifulSoup(fh, 'html.parser')
table = soup.find_all('table')
cols = table[0].find_all('tr')
cells = cols[1].find_all('td')`
私は取得しない:まず、私は自分のコンピュータ上のHTMLファイルとしてページを保存しますが、私は次のコードで解析しようとすると、(この部分は、私はすべての情報を得たことを確認し正常に動作します)結果(特に、インデックス1に要素がないと言ってクラッシュします)。それがどこから来たのだろうか?
おかげ
私のために動作します、あなたは正しいHTMLファイルを解析していますか? – alecxe
3行目の 'table'と' [0] 'の間にスペースがあります。一方、以前は同様の問題がありましたが、htmlが掘り下げられると美しいスープはそれを処理できないことがわかりました。私は別の 'htmlパーサー 'を試しましたが、解決策を見つけることができませんでした。 – Leustad
私は正しいHTMLファイルを解析していますが、少なくともメモ帳で開いたときに正しいと思われます。 スペースについては、誤ってタイプミスでしたが、私のコードには表示されませんでした。 – aeboq