で行をフェッチします。使用BeautifulSoupは、私がこのようなHTML構造を持つヘッダ
BlendInfo = namedtuple('BlendInfo', ['brand', 'type', 'contents', 'flavoring'])
stats_rows = soup.find('table', id='stats').find_all('tr')
bi = BlendInfo(brand = stats_rows[1].td.get_text(),
type = stats_rows[2].td.get_text(),
contents = stats_rows[3].td.get_text(),
flavoring = stats_rows[4].td.get_text())
しかし、それはインデックスうち境界(または本当にめちゃくちゃ取得)に失敗した予想通り、テーブルの順序が異なる場合(ブランドの前のタイプ)、または一部:この私はこのようなコードをしたスクラップする
行のうち欠落しています(内容なし)。
のようなものに任意のより良い方法があります:
これはあなたのためのdictを建設する「ブランド」の文字列で私にヘッダと行からのデータを与える