0
テーブルがあるhtmlファイルがあります。この表には30個の列がありますが、私は少しだけ読む必要があります。これまでBeautifulSoupを使用して読み込む列を指定する方法
コード:
from bs4 import BeautifulSoup
soup = BeautifulSoup(open("myfile.htm"))
table = soup.find("table", attrs={"class":"myTable"})
# The first tr contains the field names.
headings = [th.get_text() for th in table.find("tr").find_all("th")]
datasets = []
for row in table.find_all("tr")[1:]:
dataset = zip(headings, (td.get_text() for td in row.find_all("td")))
datasets.append(dataset)
for dataset in datasets:
for field in dataset:
print "{0:<16}: {1}".format(field[0], field[1])
どのように私は私が読みたい列を指定できますか? BeautifulSoupで
あなたの「投票閉じる」の理由を追加してください。ありがとう! – PlayHardGoPro
質問があまりにも曖昧です。詳細が必要です。あなたの探しているデータの形式は何ですか?あなたが望んでいるtdのIDはありますか?どちらをお望みですか?なぜあなたは夫婦だけが必要な場合は、すべてのtdのをつかんでいますか?あなたのコードはちょうどどこかからそれを貼り付けてコピーするように見えますが、あなたはそれを修正する方法を知らず、疑問は十分に曖昧です。 – FuriousGeorge
myfile.htmを見てください。あなたは科学のために知っていますか? ; D – silberbaum