2017-03-09 23 views
0

テーブルがあるhtmlファイルがあります。この表には30個の列がありますが、私は少しだけ読む必要があります。これまでBeautifulSoupを使用して読み込む列を指定する方法

コード:

from bs4 import BeautifulSoup 

soup = BeautifulSoup(open("myfile.htm")) 
table = soup.find("table", attrs={"class":"myTable"}) 

# The first tr contains the field names. 
headings = [th.get_text() for th in table.find("tr").find_all("th")] 

datasets = [] 
for row in table.find_all("tr")[1:]: 
    dataset = zip(headings, (td.get_text() for td in row.find_all("td"))) 
    datasets.append(dataset) 

for dataset in datasets: 
    for field in dataset: 
     print "{0:<16}: {1}".format(field[0], field[1]) 

どのように私は私が読みたい列を指定できますか? BeautifulSoupで

+0

あなたの「投票閉じる」の理由を追加してください。ありがとう! – PlayHardGoPro

+0

質問があまりにも曖昧です。詳細が必要です。あなたの探しているデータの形式は何ですか?あなたが望んでいるtdのIDはありますか?どちらをお望みですか?なぜあなたは夫婦だけが必要な場合は、すべてのtdのをつかんでいますか?あなたのコードはちょうどどこかからそれを貼り付けてコピーするように見えますが、あなたはそれを修正する方法を知らず、疑問は十分に曖昧です。 – FuriousGeorge

+1

myfile.htmを見てください。あなたは科学のために知っていますか? ; D – silberbaum

答えて

関連する問題