beautifulsoupを使用してマルチボディhtmlテーブルからセル値を抽出します

私はHTMLに複数のtablesを持っています。次に、必要なテーブルに複数のtbodyがあります。しかし、私はbeautifulsoupを使用してマルチボディhtmlテーブルからセル値を抽出します

tables = soup.findAll("table", {"class": "annotation"}).findAll("tbody",{"class":"annotation"})

を使用して、特定のテーブルとTBODYを選択することができています。しかし、その後私は、体内に存在tr & td情報を取得することができません。私は上記の行の結果を印刷する場合、それは

<tbody class="annotation"></tbody>

を与え、私はrows = tables.find_all('tr')をしようとすると、それはnullを返しますので。

全体のHTMLはかなり大きくて、私は画像を追加したので、ここに挿入することが困難であると私は私のカーソルが

あなたは、少なくともリンクを提供することができ、与えられた画像である値を抽出したいです？

また、要素単位で行う必要があります。 findは、単一の要素を返します。 findAllは、リストに1つの項目のみが含まれていてもリストを返します。

ので、私の野生の推測がある：

tables = soup.find("table", {"class": "annotation"}).find_all("tbody",{"class":"annotation"})[0] 
rows = tables.findAll("tr")

ああ、私はあなたがこのthreadから男だということに気づきました。私はそのスレッドでWebページを掻き集めようとしましたが、JavaScriptの実行が必要です。私の助言はこれと組み合わせた他のスレッドのコードを使用しています。あなたに何が起こったのか教えてください。

2017-07-21 18:13:03 Mohamed

答えて